2017 年出版322 页ISBN:9787121314384
《大数据之路:阿里巴巴大数据实践》是由阿里巴巴数据技术及产品部的几位资深员工结合实践完成的一本大数据实践力作。主要分析阿里巴巴近几年的数据挖掘、分析、应用的探索经历。本书适合所有搞数据研究、数...
2017 年出版65 页ISBN:9787307127692
本书是一本数据挖掘和机器学习领域入门阶段的实验教材,每章由知识要点和实验两个部分组成。知识要点部分给出了实验内容对应的知识脉络,以及对相关问题的理解和分析方法。实验部分以Mahout工具包为实验平台,针...
2017 年出版494 页ISBN:7115463662
本系列图书以“大数据分析师”应掌握的IT技术为主线,共两卷7个模块。本书是第1卷,共4个模块,分别介绍大数据入门,分析和R编程入门,使用R进行数据分析,用R进行高级分析。通过本书,读者能对大数据概念、重要性及其应...
2017 年出版275 页ISBN:9787121316180
本书涵盖大数据专业经典的40个实验,每一个实验给出具体的目的、要求、原理,并给出详细的实验步骤和试验程序。具体包括HDFS实验、YARN实验、MapReduce实验、Hive实验、Spark实验、ZooKeeper实验、HBase实验、...
2016 年出版136 页ISBN:9787506684880
本书主要探讨标准文献大数据的实践应用,利用大数据的思路和最新技术,解决国家标准馆面临的实际问题,主要内容包括:大数据概述、大数据存储、大数据组织、大数据挖掘、大数据关联、大数据可视化。可以供从事研究...
2016 年出版332 页ISBN:9787111519096
书中第1章首先通过介绍Spark的生态系统和RDD编程模型,使读者能够快速的对Spark技术的生态环境以及对Spark的RDD编程模型有个非常直观的了解。第2章,首先介绍了Spark应用的两种部署模式;然后在应用部署模式基础...