书籍介绍
本书共14章,主要内容包括:第1章探讨数据分析的基本原理和数据分析步骤。第2章解释如何清洗并准备好数据并介绍了数据清洗工具OpenRefine。第3章展示在JavaScript可视化框架下应用D3.js语言来实现各类数据的可视化方法。第4章介绍如何应用朴素贝叶斯算法来区分垃圾邮件。第5章介绍了一个应用动态时间规整方法来寻找图像间相似性的项目。第6章解释如何使用随机游走算法和可视化的D3.js动画技术来模拟股票价格。第7章介绍核岭回归(KRR)的原理以及如何使用此方法和时间序列数据来预测黄金价格。第8章描述如何使用支持向量机的方法进行分类分析。第9章应用细胞自动机的方法对传染病进行建模。第10章解释如何应用Gephi从Facebook获取你的社会化媒体图谱并使之实现可视化。第11章介绍如何应用Twitter数据进行情感分析。第12章介绍使用MongoDB进行数据处理和聚合。第13章详细介绍了如何在MongoDB数据库中应用MapReduce编程模型。第14章介绍如何应用IPython和Wakari开展线上数据分析。