第1章 绪论 1
1.1 大数据的概念和特征 1
1.2 大数据的发展趋势 3
1.3 大数据的应用价值 46
1.4 数据挖掘的产生与功能分析 52
1.5 大数据的处理方法 65
1.6 本章小结 83
第2章 大数据处理相关技术与研究现状 84
2.1 云技术研究现状 84
2.2 大数据的分布式和并行计算研究现状 86
2.3 数据存储研究现状 99
2.4 大数据分析及挖掘研究现状 101
2.5 大数据处理架构Hadoop 105
2.6 云计算和大数据的智能应用分析 116
2.7 本章小结 192
第3章 基于大数据的线性分类模型的探索 193
3.1 线性分类模型的研究方法 193
3.2 线性分类模型的研究内容 198
3.3 线性判别式的比较分析与优化方法研究 201
3.4 基于线性回归分析的特征抽取及分类应用研究 206
3.5 本章小结 210
第4章 大数据的分类分析模型研究 211
4.1 分类分析的定义 211
4.2 分类分析的原理和策略方法 212
4.3 主要分类模型 216
4.4 分类模型的评估指标 234
4.5 分类分析模型实例分析 237
4.6 基于决策树的分类分析算法的改进与应用分析 240
4.7 本章小结 248
第5章 基于神经网络与人工智能的大数据分析方法研究 249
5.1 神经网络 249
5.2 神经网络的结构及工作方式 253
5.3 人工神经网络与计算智能的研究内容与趋势 261
5.4 主要分析方法 281
5.5 本章小结 293
第6章 数据关联规则挖掘及相关算法 294
6.1 数据关联规则概念 294
6.2 数据关联规则相关算法的研究内容 296
6.3 主要数据关联规则挖掘算法 300
6.4 关联规则有效性的评估指标与策略方法 309
6.5 本章小结 311
第7章 基于Hadoop的分布式算法的设计与实现 312
7.1 分布式文件访问与计算的研究内容 312
7.2 基于Hadoop的分布式算法分析和模型实现 328
7.3 基于Hadoop的一种网络结构化分布式算法 331
7.4 一种基于密度的分布式算法 333
7.5 实验设计与分析 334
7.6 本章小结 335
第8章 大数据分析中的聚类算法研究 336
8.1 大数据分析中聚类分析算法的研究现状 336
8.2 大数据分析中聚类分析算法的研究内容 337
8.3 聚类分析相关算法 341
8.4 算法性能评价指标 357
8.5 大数据处理平台下聚类算法的实验结果与分析 358
8.6 本章小结 360
第9章 大数据分析算法的并行化研究 361
9.1 大数据分析中并行化研究现状 361
9.2 大数据分析中并行化算法的研究内容 362
9.3 大数据分析中相关并行化算法 369
9.4 算法性能评价指标 403
9.5 基于Map Reduce的大数据处理并行算法的优化 403
9.6 大数据分析并行化算法应用案例分析 408
9.7 本章小结 414
第10章 大数据计算平台 415
10.1 数据并行计算框架Spark的研究内容 415
10.2 数据并行运行时平台Hyracks分析 432
10.3 Storm流计算系统特征 435
10.4 本章小结 451
参考文献 453