书籍介绍
全书分为三篇,第一篇讲解了Hadoop的原生态组件,包括Hadoop以及Zookeeper、Hbase、Hive环境搭建与安装,以及对MapReduce、HDFS、Zookeeper、Hbase、Hive的原理介绍和实战操作。第二篇讲解了Spark的原生态组件,包括Scala、SparkSql、SparkStreaming、Dataframe,以及对Scala、SparkSql、SparkStreaming、Dataframe的原理介绍和实战操作。第三篇讲解了离线项目和在线项目,将Hadoop和Spark原生态组件进行整合。