第1章 基础知识 1
1.1 机器学习简介 2
1.1.1 基本概念 2
1.1.2 机器学习分类 3
1.2 Python基础 5
1.2.1 Python编程环境 5
1.2.2 基本数据类型 11
1.2.3 分支语句和循环语句 18
1.2.4 函数 21
1.2.5 类和对象 25
1.2.6 打开、关闭、读/写文件 28
1.2.7 异常处理 31
1.3 常用第三方库 33
1.3.1 NumPy 33
1.3.2 SciPy 39
1.3.3 Pandas 41
1.3.4 Matplotlib 53
1.3.5 Scikit-learn 56
1.4 案例分析 58
1.4.1 网络爬虫及信息提取 58
1.4.2 股票数据图表绘制 63
1.5 本章小结 69
1.6 参考文献 69
第2章 分类案例 71
2.1 员工离职预测 72
2.1.1 问题描述及数据集获取 72
2.1.2 求解思路和相关知识介绍 73
2.1.3 代码实现及分析 76
2.2 Iris数据分类 81
2.2.1 问题描述及数据集获取 81
2.2.2 求解思路和相关知识介绍 82
2.2.3 代码实现及分析 89
2.3 新闻文本分类 99
2.3.1 问题描述及数据集获取 99
2.3.2 求解思路和相关知识介绍 100
2.3.3 代码实现及分析 113
2.4 手写数字识别 128
2.4.1 问题描述及数据集获取 128
2.4.2 求解思路和相关知识介绍 129
2.4.3 代码实现及分析 134
2.5 本章小结 139
2.6 参考文献 139
第3章 聚类案例 143
3.1 人脸图像聚类 144
3.1.1 问题描述及数据集获取 144
3.1.2 求解思路和相关知识介绍 146
3.1.3 代码实现及分析 150
3.2 文本聚类 162
3.2.1 问题描述及数据集获取 162
3.2.2 求解思路和相关知识介绍 163
3.2.3 代码实现及分析 167
3.3 本章小结 173
3.4 参考文献 174
第4章 回归预测案例 175
4.1 房价预测 176
4.1.1 问题描述及数据集获取 176
4.1.2 求解思路和相关知识介绍 177
4.1.3 代码实现及分析 184
4.2 基于LSTM的股票走势预测 191
4.2.1 问题描述及数据集获取 191
4.2.2 求解思路和相关知识介绍 192
4.2.3 代码实现及分析 197
4.3 本章小结 204
4.4 参考文献 204
第5章 综合案例 206
5.1 场景文本检测 207
5.1.1 问题描述及数据集获取 207
5.1.2 求解思路和相关知识介绍 208
5.1.3 代码实现及分析 217
5.2 面部认证 235
5.2.1 问题描述及数据集获取 236
5.2.2 求解思路和相关知识介绍 236
5.2.3 代码实现及分析 241
5.3 本章小结 275
5.4 参考文献 275
附录A 277
A.1 逻辑回归分类器原理介绍 278
A.2 自己编程实现决策树分类器 280
A.3 支持向量机的数学推导 287
A.3.1 最小间隔最大化 287
A.3.2 对偶问题 288
A.4 Adaboost的数学推导和代码实现 292
A.4.1 数学推导 292
A.2 代码实现 294
A.5 神经网络的数学推导和代码实现 298
A.5.1 数学推导 298
A.5.2 代码实现 302
A.6 期望最大化算法和高斯混合模型 308
A.6.1 EM算法的原理和数学推导 308
A.6.2 EM算法估计高斯混合模型参数的数学推导 310
A.7 基于波士顿房价数据集的房价预测代码实现 312