书籍 数据算法  Hadoop/Spark大数据处理技巧的封面

数据算法 Hadoop/Spark大数据处理技巧

(美)马哈默德·帕瑞斯安(Mahmoud Parsian)

出版社

北京:中国电力出版社

出版时间

2016

ISBN

9787512395947

标注页数

680 页

PDF页数

694 页

书籍介绍
本书介绍了很多基本设计模式、优化技术和数据挖掘及机器学习解决方案,以解决生物信息学、基因组学、统计和社交网络分析等领域的很多问题。这本书还概要介绍了MapReduce、Hadoop和Spark。本书主要内容包括:完成超大量交易的购物篮分析。数据挖掘算法(K-均值、KNN和朴素贝叶斯)。使用超大基因组数据完成DNA和RNA测序。朴素贝叶斯定理和马尔可夫链实现数据和市场预测。推荐算法和成对文档相似性。线性回归、Cox回归和皮尔逊(Pearson)相关分析。等位基因频率和DNA挖掘。社交网络分析(推荐系统、三角形计数,情感分析)。
在线购买PDF电子书