大数据工具集合
随着大数据与预测分析的成熟,开源作为底层技术授权解决方案的最大贡献者的优势越来越明显。如今,从小型初创企业到行业巨头,各种规模的供应商都在使用开源来处理大数据和运行预测分析。借助开源与云计算技术,新兴公司甚至在很多方面都可以与大厂商抗衡。以下是一些大数据方面的顶级开源工具,分为四个领域:数据存储、开发平台、开发工具和集成、分析和报告工具。数据存储:Apache H
·
随着大数据与预测分析的成熟,开源作为底层技术授权解决方案的最大贡献者的优势越来越明显。
如今,从小型初创企业到行业巨头,各种规模的供应商都在使用开源来处理大数据和运行预测分析。借助开源与云计算技术,新兴公司甚至在很多方面都可以与大厂商抗衡。
以下是一些大数据方面的顶级开源工具,分为四个领域:数据存储、开发平台、开发工具和集成、分析和报告工具。
数据存储:
- Apache Hadoop–Cloud Foundry(VMware),Hortonworks,Hadapt
- NoSql 数据库 – MongoDB, Cassandra, Hbase
- SQL 数据库 – MySql(Oracle),MariaDB,PostgreSQL,TokuDB
开发平台:
- Apache Hadoop平台 – Impala(开源大数据分析引擎); Lingual(ANSI SQL); Pattern(analytics); Cascading(开源大数据应用程序开发框架)
- Apache Lucene和Solr平台
- OpenStack(构建私有云和公有云)
- Red Hat (搭载 Hadoop 服务器的标准 Linux 发行版)
- REEF(微软的Hadoop开发者平台)
- Storm(集成了各种排队系统和数据库系统)
开发工具和集成:
- Apache Mahout(机器学习的编程语言)
- Python 和 R(预测分析编程语言)
分析和报告工具:
- Jaspersoft(报告和分析服务器)
- Pentaho(数据集成和业务分析)
- Splunk(IT分析平台)
- Talend(大数据集成,数据管理和应用集成)
更多推荐
已为社区贡献1条内容
所有评论(0)