(美)乔治·特鲁希略(George Trujillo),(美)查尔斯·吉姆(Charles Kim),(美)史蒂夫·琼斯(Steve Jones),(美)隆美尔·加西亚(Rommel Garcia),(美)贾斯汀·默里(Justin Murray)著2019 年出版358 页ISBN:9787115497543
本书包括三部分内容:第一部分带你理解Hadoop的SQL引擎和理解Hadoop生态系统关于多租户的关键领域;第二部分适合掌握Hadoop但需要理解虚拟化的读者。包括“虚拟化基础”和“最佳实践虚拟化Hadoop”;第三部分将H...
MarkGrover,TedMalaska,JonatbanSeidman等著2017 年出版376 页ISBN:9787564170011
在使用 Apache Hadoop 设计端到端数据管理解决方案时获得专家级指导。当其他很多渠道还停留在解释 Hadoop生态系统中该如何使用各种纷繁复杂的组件时,这本专注实践的书已带领你从架构的整体角度思考,它对于你...
张良均等著2016 年出版290 页ISBN:9787111522652
本书共14章,分三个部分:基础篇、实战篇、高级篇。基础篇介绍了数据挖掘、Hadoop大数据的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得大数据项目挖掘分析...
徐鹏著2016 年出版554 页ISBN:7121281554
HDFS是运行在通用硬件上的分布式文件系统,本书详细介绍了HDFS体系结构、基本概念、通信协议及主要流程,具体包括Hadoop RPC框架的使用及实现、文件系统目录树、数据块管理、数据节点管理、租约管理、缓存管理...
(美)本·斯派维(BenSpivey),乔伊·爱彻利维亚(JoeyEcheverria)著2017 年出版242 页ISBN:9787115467713
本书阐述了Hadoop从早期开放的消费互联网时代到现在作为敏感数据可信平台的演变历程,介绍了包括身份验证、加密、密钥管理和商业实践在内的诸多主题,并在实际环境下加以讨论。第1章是介绍性内容,随后分为四大...
(美)卢博林斯凯著2014 年出版425 页ISBN:9787302369066
本书从Hadoop的缘起开始,由浅入深,结合理论和实践,全方位地介绍Hadoop这一高性能处理海量数据集的理想工具。内容不仅包括了Apache Hive、Pig、MapReduce、Mahout、Giraph、HDFS、Accumulo、Redis、Ganglia等...
Hadoop专家 管理、调优与Spark YARN HDFS安全
(美)Sam R.Alapati(山姆·阿拉帕蒂)2019 年出版726 页ISBN:9787121356698
本书将有关创建、配置、保护和管理大数据的权威知识整理汇集,并介绍了如何优化生产环境下的Hadoop集群。同时作者利用他对大规模Hadoop的管理经验,对整合导向做了仔细研究,并对其问题进行解释且提供建议的解决...
余辉著2017 年出版337 页ISBN:9787302479673
全书分为三篇,第一篇讲解了Hadoop的原生态组件,包括Hadoop以及Zookeeper、Hbase、Hive环境搭建与安装,以及对MapReduce、HDFS、Zookeeper、Hbase、Hive的原理介绍和实战操作。第二篇讲解了Spark的原生态组件,包...
(美)怀特著2015 年出版730 页ISBN:9787564159177
通过这本综合性指南的第四版,你将会学习到如何通过Apache Hadoop建立和维护可靠的、可扩展的分布式系统。本书是期望分析任意大小的数据集的程序员以及想建立和运行Hadoop集群的管理员的理想选择。在这本面...
范东来著2015 年出版318 页ISBN:9787115380999
本书主要介绍Hadoop技术的相关知识,并将理论知识与实际项目相结合。全书共分为三个部分:基础篇、应用篇和结束篇。基础篇详细介绍了Hadoop、MapReduce、HDFS、Hive和Sqoop,并深入探讨了Hadoop的运维和调优;应...