2018 年出版222 页ISBN:9787302494256
《大数据库操作》教材讲述了目前广泛使用的几种大数据库产品:Hadoop数据库HBase、数据仓库工具Hive、内存大数据计算框架Spark的工作原理以及它们的部署、配置、命令、SQL语句等常用操作,以浅显易懂的语言风...
2018 年出版180 页ISBN:9787302503217
本书首先介绍了分布式实时计算系统整体架构,接着配以实例介绍了使用kafka进行数据流处理、Zookeeper的分布式协调处理、HBase数据存储的方式方法;同时重点讲解了Storm的实时处理体系。最后,通过实际案例,综合应...
大数据开发者权威教程 NoSQL Hadoop组件及大数据实施
2018 年出版457 页ISBN:9787115493712
本系列书涵盖了大数据开发工作的核心内容,全面且详尽地涵盖了大数据开发的各个领域。本书包括大数据的概述、管理大数据生态系统、数据的存储和处理、用Hadoop工具提高效率、Hadoop的高级特性、利用NoSQL数...
2015 年出版192 页ISBN:9787115388537
本书先介绍实时大数据平台架构上的一些知识和难点,然后引入Storm来解决其中的问题。开始介绍Storm开发,再分享Storm集群中性能调优、资源隔离的一些知识和经验,然后加入Storm监控和日志的内容。后面介绍如何通...
2014 年出版172 页ISBN:9787121226496
本书是一本系统并且具有实践指导意义的Storm工具书和参考书,对Storm整个技术体系进行了全面的讲解,不仅包括对基本概念、特性的介绍,也涵盖了一些原理说明。...
2017 年出版228 页ISBN:9787302477365
全书分为4大部分,第1部分介绍大数据的业务潜在需求,包括大数据业务授权、大数据业务模型成熟度索引、大数据策略文档、用户体验的重要性等,第2部分介绍数据科学,包括商务智能与数据科学的区别、数据科学入门、...
2017 年出版207 页ISBN:9787121315756
如今,海量的数据无处不在,从数据中提取出关键信息的能力显得愈发重要。本书从崭新的视角认识大数据,研究了钢铁行业中的典型大数据案例,为读者提供进行数据网络分析、数据中有效信息提取的详细步骤和指导方法。...
2017 年出版322 页ISBN:9787121314384
《大数据之路:阿里巴巴大数据实践》是由阿里巴巴数据技术及产品部的几位资深员工结合实践完成的一本大数据实践力作。主要分析阿里巴巴近几年的数据挖掘、分析、应用的探索经历。本书适合所有搞数据研究、数...
2017 年出版65 页ISBN:9787307127692
本书是一本数据挖掘和机器学习领域入门阶段的实验教材,每章由知识要点和实验两个部分组成。知识要点部分给出了实验内容对应的知识脉络,以及对相关问题的理解和分析方法。实验部分以Mahout工具包为实验平台,针...
2017 年出版275 页ISBN:9787121316180
本书涵盖大数据专业经典的40个实验,每一个实验给出具体的目的、要求、原理,并给出详细的实验步骤和试验程序。具体包括HDFS实验、YARN实验、MapReduce实验、Hive实验、Spark实验、ZooKeeper实验、HBase实验、...
2016 年出版136 页ISBN:9787506684880
本书主要探讨标准文献大数据的实践应用,利用大数据的思路和最新技术,解决国家标准馆面临的实际问题,主要内容包括:大数据概述、大数据存储、大数据组织、大数据挖掘、大数据关联、大数据可视化。可以供从事研究...