黑马程序员编著2019 年出版290 页ISBN:9787302524403
本书围绕Hadoop生态圈相关系统介绍大数据处理架构。全书共11章,其中,第1-2章主要带领大家认识Hadoop以及学会搭建Hadoop集群。第3-5章讲解了分布式文件系统HDFS、分布式计算框架MapReduce以及分布式协调服务...
(美)韦斯·麦金尼(Wes McKinney)2018 年出版480 页ISBN:9787111603702
阅读本书可以获得关于在Python下操作、处理、清洗、规整数据集的完整说明。本书第2版针对Python 3.6进行了更新,并增加了实际案例向你展示如何高效地解决一系列数据分析问题。你将在阅读过程中学习到最新版...
黄申著2017 年出版425 页ISBN:9787111569695
本书介绍了一些主流技术在商业项目中的应用,包括机器学习中的分类、聚类和线性回归,搜索引擎,推荐系统,用户行为跟踪,架构设计的基本理念及常用的消息和缓存机制。在这个过程中,我们有机会实践R、Mahout、Solr、E...
丁维龙,赵卓峰,韩燕波编著2015 年出版250 页ISBN:9787121195686
Storm作为实时的、分布式以及具备高容错的流式计算系统,,对比适于海量数据批处理的hadoop,不仅简化了数据流上相关处理的并行编程复杂度,也提供了数据处理实时性、可靠性和集群节点动态伸缩的特性。。本书通过...
中国地震局震灾应急救援司,中国地震学会地震应急专业委员会2017 年出版140 页ISBN:9787502844745
这是第一本讨论大数据在地震应急工作中应用的论文集,其中涵盖了大数据方法、思维通论、在地震应急工作中的应用探索、在其他领域中的成功应用、在日本的大数据应用模式、地震应急可能的卫星数据来源和支持等...
(美)杰奎琳·卡兹奥(Jacqueline Kazil),(美)凯瑟琳·嘉穆(Katharine Jarmul)著2017 年出版492 页ISBN:9787564170035
如何让你的数据分析技能超越Excel到更高的水平?通过深入学习Python来完成工作。这本实践指南向非程序员展示了如何处理本质上太杂乱或难以下手的信息。你不需要了解Python编程语言基础知识就可以开始了。通...
马建堂主编2013 年出版194 页ISBN:9787503769979
随着科学技术的进步和生产力水平的提升,在世界范围内,大规模生产、分享和应用数据的时代——大数据时代正在到来。政府统计机构需要积极应对大数据带来的影响和挑战,制定切实可行的策略和措施,推动统计生产力发...
高彦杰著2014 年出版255 页ISBN:9787111483861
全书9章,共分为4个部分:第1-3章介绍了Spark的体系结构、集群环境的部署和计算模型,以及Intel、淘宝、腾讯和网易几个大公司的Spark应用案例;第4-6章讲解了Spark工作机制、Spark应用程序开发流程开流程,然后讲解...
(法)戴维·西伦,(法)亚诺D.B.梅斯曼,(法)穆罕默德·阿里著;王艳,刘义,于晨昕等译2017 年出版224 页ISBN:9787111578260
本书涵盖的主题非常广泛,介绍了数据科学方方面面的知识,每一章都侧重于介绍数据科学的某一方面,为读者以后的深入学习打下基础。具体内容包括:第1、2章系统介绍大数据科学的背景知识及框架结构;第3~5章介绍机器...
陈为,巫英才,鲍虎军等著2019 年出版441 页ISBN:9787122321725
本书首先介绍了大数据可视分析的基本方法,包括交互智能分析框架、文本数据、图数据、多维数据、不确定性数据的介绍;接着介绍了大数据可视分析的应用,包括科学计算、社交媒体数据分析、时空数据分析、城市数据...