书籍 大数据清洗技术=BIG  DATA  CLEANING的封面

大数据清洗技术=BIG DATA CLEANINGPDF电子书下载

王宏志著

购买点数

20

出版社

出版时间

2020

ISBN

标注页数

0 页

PDF页数

320 页

图书目录

第1章 绪论 1

1.1 大数据的定义及其应用 2

1.2 数据质量问题 4

1.3 大数据的质量问题与挑战 12

1.4 数据清洗研究进展 13

1.5 本书的内容 16

本章参考文献 17

第2章 大数据处理技术概述 21

2.1 大数据并行计算平台 22

2.2 众包技术 26

本章参考文献 29

第3章 实体识别 30

3.1 实体识别概述 31

3.2 串行实体识别算法 35

3.3 并行实体识别算法 45

3.4 增量实体识别算法 77

3.5 基于众包的实体识别 94

本章参考文献 100

第4章 真值发现 107

4.1 真值发现算法概述 108

4.2 并行真值发现算法 109

4.3 增量真值发现算法 127

4.4 基于众包的真值发现 140

本章参考文献 144

第5章 缺失值填充 145

5.1 缺失值填充算法概述 146

5.2 基于贝叶斯网络的串行缺失值填充算法 150

5.3 实验结果及分析 175

5.4 并行缺失值填充算法 182

5.5 基于众包的缺失值填充算法 196

本章参考文献 202

第6章 不一致数据检测与修复 205

6.1 不一致数据检测与修复概述 206

6.2 并行不一致数据检测与修复算法 211

6.3 基于众包的不一致数据检测与修复算法 225

6.4 扫描数据一次的大数据不一致检测算法 229

本章参考文献 244

第7章 多数据质量问题综合清洗与优化 249

7.1 数据质量维度的关联 250

7.2 基于任务合并的并行数据清洗优化 274

7.3 综合大数据清洗系统 293

本章参考文献 303

名词索引 307

查看更多关于的内容

出版社其它书籍
本类热门
在线购买PDF电子书
下载此书RAR压缩包