大数据测试-hive、doris、clickhouse、mysql、elasticsearch、kudu、postgresql、sqlserver

大数据工作要接触很多的数据库和查询引擎数据库：1、hive：用于跑批，大批量，稳定，缺点：无update。用于数仓2、doris：已更名starrocks。即时查询可达千亿级别3、clickhouse：亿级别局限性：主表，单表支持能力强，join能力弱4、mysql：开源免费，十万级别查询5、elasticsearch：不支持join，有些函数不支持优点是检索快6、kudu：能支持updat

软件测试李同学

7706人浏览 · 2022-02-16 11:35:55

软件测试李同学 · 2022-02-16 11:35:55 发布

大数据工作要接触很多的数据库和查询引擎

数据库：
1、hive：用于跑批，大批量，稳定，缺点：无update。用于数仓
2、doris db：已更名starrocks。即时查询可达千亿级别

文档：什么是 StarRocks @ StarRocks_intro @ StarRocks Docs
3、clickhouse：亿级别局限性：主表，单表支持能力强，join能力弱
4、mysql：开源免费，十万级别查询
5、elasticsearch：不支持join，有些函数不支持优点是检索快
6、kudu：能支持update、千万级别。数据量大（百亿级别）性能问题明显
7、postgresql:关系型数据库，支持很多分布式集群软件
8、sqlserver：windows运行，常用saas软件，数据在本地，比如医院。。

查询引擎：
1、impala：支持duku、hive，兼容性方面，对duku支持更佳，常用查询kudu
2、presto：支持duku、hive，兼容性方面，对hive支持更佳，常用查询hive
2个都属于查询引擎，其实是一样的产品，不同公司研发（其实也支持mysql，但是没必要再包一层去查询）