Spark有哪些特点？

Spark计算框架在处理数据时，所有的中间数据都保存在内存中。正是由于Spark充分利用内存对数据进行计算，从而减少磁盘读写操作，提高了框架计算效率。同时Spark还兼容HDFS、Hive，可以很好地与Hadoop系统融合，从而弥补MapReduce高延迟的性能缺点。所以说，Spark是一个更加快速、高效的大数据计算平台。Spark入门到精通：Spark3.0教程 Spark3.0从入门到精通Sp

是一只萨摩耶

12708人浏览 · 2021-11-19 15:20:15

是一只萨摩耶 · 2021-11-19 15:20:15 发布

Spark计算框架在处理数据时，所有的中间数据都保存在内存中。正是由于Spark充分利用内存对数据进行计算，从而减少磁盘读写操作，提高了框架计算效率。同时Spark还兼容HDFS、Hive，可以很好地与Hadoop系统融合，从而弥补MapReduce高延迟的性能缺点。所以说，Spark是一个更加快速、高效的大数据计算平台。

Spark入门到精通：Spark3.0教程 Spark3.0从入门到精通

Spark具有以下几个显著的特点：

1、速度快

小生根据官方数据统计，与Hadoop相比，Spark基于内存的运算效率要快100倍以上，基于硬盘的运算效率也要快10倍以上。Spark实现了高效的DAG执行引擎，能够通过内存计算高效地处理数据流。

2、易用性

Spark编程支持Java、Python、Scala及R语言，并且还拥有超过80种高级算法，除此之外，Spark还支持交互式的Shell操作，开发人员可以方便地在Shell客户端中使用Spark集群解决问题。

3、通用性

Spark提供了统一的解决方案，适用于批处理、交互式查询(SparkSQL)、实时流处理(SparkStreaming)、机器学习(SparkMLlib)和图计算(GraphX)，它们可以在同一个应用程序中无缝地结合使用，大大减少大数据开发和维护的人力成本和部署平台的物力成本。

4、兼容性

Spark开发容pSpark可以运行在Hadoop模式、Mesos模式、Standalone独立模式或Cloud中，并且还可以访问各种数据源，包括本地文件系统、HDFS、Cassandra、HBase和Hive等。

相关教程：

Hadoop3.x全套教程，一套精通Hadoop的大数据必看教程

数据库系统Cassandra全套教程，快速精通Cassandra分布式结构化数据存储

大数据教程HBase海量数据存储实战

Hive最新全套教程，大数据Hive3.x数仓开发精讲到企业级实战应用

华为开发者空间

华为开发者空间，是为全球开发者打造的专属开发空间，汇聚了华为优质开发资源及工具，致力于让每一位开发者拥有一台云主机，基于华为根生态开发、创新。

更多推荐

cover

GaussDB数据库高可用部署方案

华为开发者空间

cover

在华为开发者空间，简单几步带你实现AI风格化编程

华为开发者空间

cover

GaussDB关键技术原理|高弹性：hashbucket介绍

华为开发者空间

所有评论(0)

查看更多评论

是一只萨摩耶

已为社区贡献7条内容