本书系统介绍了大数据的相关知识,分为大数据基础篇、大数据存储与管理篇、大数据处理与分析篇、大数据应用篇。全书共15章,内容包含大数据的基本概念、大数据处理架构Hadoop、分布式文件系统HDFS、分布式数据库HBase、NoSQL数据库、云数据库、MapReduce、Spark、流计算、图计算、数据可视化以及大数据在互联网、生物医学领域和其他行业的应用。本书在Hadoop、HDFS、HBase、MapReduce和Spark等重要章节安排了入门级的实践操作,以便读者更好地学习和掌握大数据关键技术。

 

前言

距离第一版过去1年里,大数据技术发展迅猛,诸如Spark等新技术迅速崛起,开始改变Hadoop一枝独秀的市场格局。因此,我们及时对第1版内容进行了补充和修订,以适应大数据技术的快速发展,保持本书的先进性和实用性。

本书依然沿用第1版的篇章设计,共分四大部分,包括大数据基础篇、大数据存储与管理篇、大数据处理与分析篇和大数据应用篇。在大数据基础篇中,第1章介绍大数据的基本概念和应用领域,并阐述大数据、云计算和物联网的相互关系;第2章介绍大数据处理架构Hadoop,并补充介绍了Hadoop版本演化。在大数据存储与管理篇中,第3章介绍了分布式文件系统HDFS,在编程实践部分根据最新版本的API进行了修订;第4章介绍了分布式数据库HBase,在编程实践部分根据最新版本的API进行了修订;第5章介绍了NoSQL数据库;第6章介绍了云数据库。在大数据处理与分析篇中,首先在第7章介绍了分布式并行编程模型MapReduce,然后在新增的第8章中对Hadoop进行了再探讨,介绍了Hadoop的发展演化和一些新特性,并在新增的第9章中介绍了当前比较热门的、基于内存的分布式计算框架Spark,在第10章和第11章分别介绍了两种典型的大数据分析技术——流计算和图计算,最后在第12章简单介绍了可视化技术。在大数据应用篇中,用3章(第13章~第15章)内容介绍了大数据在互联网、生物医学领域和其他行业的典型应用。

自第1版出版后,厦门大学数据库实验室建设了与本书配套的”中国高校大数据课程公共服务平台“(http://dblab.xmu.edu.cn/post/bigdata-teaching-platform/)为教师教学和学生学习大数据课程提供PPT讲义、学习指南、备课指南、上机习题、实验指南、技术资料、授课视频等全方位、一站式免费服务,并提供面向全国高校的大数据实验平台建设方案和大数据课程师资培训服务。

本书官方网站是http://dblab.xmu.edu.cn/post/bigdata,提供教学PPT和相关资料的下载,并接受错误反馈和发布教材勘误信息。

 

转载于:https://www.cnblogs.com/2008nmj/p/10965467.html

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐