TIDB和mysql优缺点对比

最近这几年，公司一直在使用mysql，数据量在千万级以下时，mysql有着非常优秀的性能和稳定性。随着数据增长，单表无法满足业务需求，我们需要使用mycat、shading-jdbc等中间件去实现分库分表。分库分表的缺点：分页查询性能不好，需求聚合多库数据，多次io，内存消耗大。分布式事务问题分库之后，想二次扩容，数据迁移等会更复杂跨库join很难实现随着newsql数据库出现，分库分表这些问题都

鲫鱼哥

15538人浏览 · 2021-08-06 21:10:50

鲫鱼哥 · 2021-08-06 21:10:50 发布

最近这几年，公司一直在使用mysql，数据量在千万级以下时，mysql有着非常优秀的性能和稳定性。随着数据增长，单表无法满足业务需求，我们需要使用mycat、shading-jdbc等中间件去实现分库分表。

分库分表的缺点：

分页查询性能不好，需求聚合多库数据，多次io，内存消耗大。
分布式事务问题
分库之后，想二次扩容，数据迁移等会更复杂
跨库join很难实现

随着newsql数据库出现，分库分表这些问题都得到解决，

newsql特性如下：

SQL支持（TiDB 是 MySQL 兼容的）
水平线性弹性扩展
分布式事务
跨数据中心数据强一致性保证
故障自恢复的高可用

TiDB是国产开源社区使用最广的newsql数据库，兼容mysql协议，大数据水平扩展，方便企业无门槛接入。目前接近30k的star。
在这里插入图片描述

TIDB四大核心应用场景

对数据一致性及高可靠、系统高可用、可扩展性、容灾要求较高的金融行业属性的场景

众所周知，金融行业对数据一致性及高可靠、系统高可用、可扩展性、容灾要求较高。传统的解决方案是同城两个机房提供服务、异地一个机房提供数据容灾能力但不提供服务，此解决方案存在以下缺点：资源利用率低、维护成本高、RTO (Recovery Time Objective) 及 RPO (Recovery Point Objective) 无法真实达到企业所期望的值。TiDB 采用多副本 + Multi-Raft 协议的方式将数据调度到不同的机房、机架、机器，当部分机器出现故障时系统可自动进行切换，确保系统的 RTO <= 30s 及 RPO = 0。

对存储容量、可扩展性、并发要求较高的海量数据及高并发的 OLTP 场景

随着业务的高速发展，数据呈现爆炸性的增长，传统的单机数据库无法满足因数据爆炸性的增长对数据库的容量要求，可行方案是采用分库分表的中间件产品或者 NewSQL 数据库替代、采用高端的存储设备等，其中性价比最大的是 NewSQL 数据库，例如：TiDB。TiDB 采用计算、存储分离的架构，可对计算、存储分别进行扩容和缩容，计算最大支持 512 节点，每个节点最大支持 1000 并发，集群容量最大支持 PB 级别。

Real-time HTAP 场景

随着 5G、物联网、人工智能的高速发展，企业所生产的数据会越来越多，其规模可能达到数百 TB 甚至 PB 级别，传统的解决方案是通过 OLTP 型数据库处理在线联机交易业务，通过 ETL 工具将数据同步到 OLAP 型数据库进行数据分析，这种处理方案存在存储成本高、实时性差等多方面的问题。TiDB 在 4.0 版本中引入列存储引擎 TiFlash 结合行存储引擎 TiKV 构建真正的 HTAP 数据库，在增加少量存储成本的情况下，可以同一个系统中做联机交易处理、实时数据分析，极大地节省企业的成本。

数据汇聚、二次加工处理的场景

当前绝大部分企业的业务数据都分散在不同的系统中，没有一个统一的汇总，随着业务的发展，企业的决策层需要了解整个公司的业务状况以便及时做出决策，故需要将分散在各个系统的数据汇聚在同一个系统并进行二次加工处理生成 T+0 或 T+1 的报表。传统常见的解决方案是采用 ETL + Hadoop 来完成，但 Hadoop 体系太复杂，运维、存储成本太高无法满足用户的需求。与 Hadoop 相比，TiDB 就简单得多，业务通过 ETL 工具或者 TiDB 的同步工具将数据同步到 TiDB，在 TiDB 中可通过 SQL 直接生成报表。