第一部分 大数据揭秘 3
第1章 大数据的故事 3
到了21世纪初,是什么发生了改变 4
数据为什么变得这么多 5
产生数字化数据设备的广泛应用 6
正在迅速下降的磁盘存储成本 12
RAM成本的直线下降 14
处理能力成本的直线下降 15
为什么大数据成为如此热门的话题 15
成功的大数据先驱者 18
开源软件为软件开发人员提供了竞争环境 18
云计算让启动和扩展计划变得更加容易 20
小贴士 21
问题 21
第2章 人工智能、机器学习和大数据 24
什么是人工智能和机器学习 25
人工智能的起源 26
为何近来人工智能再次兴起 27
人工神经网络和深度学习 28
人工智能如何帮助分析大数据 31
一些谨慎的话 31
小贴士 34
问题 34
第3章 为什么大数据有用 36
全新的数据使用方式 36
一种新的数据思维方式 37
遵循数据驱动的方法 38
更强的数据工具 41
小贴士 48
问题 48
第4章 大数据分析的应用案例 50
A/B测试 50
推荐引擎/下一个最佳购物建议 52
预测:需求和收入 55
节省IT成本 56
市场营销 57
社交媒体 58
定价 59
客户维系/客户忠诚度 59
购物车弃置管理(实时) 60
转化率优化 60
商品定制化(实时) 61
重新定位(实时) 61
诈骗检测(实时) 61
减少客户流失 62
预测维护 63
供应链管理 64
顾客终身价值 64
线索评分 65
人力资源 66
情绪分析 67
小贴士 68
问题 68
第5章 理解大数据生态系统 70
什么让数据变“大” 70
分布式数据存储 73
分布式计算 74
快数据/流数据 75
雾计算/边缘计算 76
开源软件 77
许可 79
代码分发 80
开源的好处 80
大数据中的开源软件 81
云计算 82
小贴士 83
问题 84
第二部分 将大数据生态系统应用到组织中 89
第6章 大数据如何指导组织战略 89
你的客户 89
获取数据 90
使用数据 97
你的竞争者 102
外部的因素 104
你的产品 105
小贴士 107
问题 107
第7章 形成大数据和数据科学的战略 109
项目团队 110
启动会议 119
启动输出 121
范围界定阶段 123
小贴士 126
问题 127
第8章 实施数据科学——分析、算法和机器学习 128
四种分析方法 128
模型、算法和黑箱 135
人工智能和机器学习 140
分析软件 143
分析工具 148
敏捷分析 149
小贴士 151
问题 152
第9章 选择技术 154
交付给最终用户 159
选择技术时需要考虑的方面 160
小贴士 166
问题 167
第10章 组建团队 168
数据科学家 169
你需要的数据角色 171
领导者 177
雇用数据团队 180
大规模招聘和收购创业公司 182
外包 184
对于小型公司 186
小贴士 187
问题 187
第11章 数据治理与法律遵从 188
个人数据 189
数据科学和隐私披露 192
数据治理 195
治理报告 197
小贴士 198
问题 199
第12章 在组织中成功部署大数据 200
我们的项目为何失败了 202
总结 209
小贴士 209
问题 210
术语 211