第1章 认识人工智能 1
1.1 何谓人工智能? 1
1.2 人工智能的发展简史 2
1.3 人工智能的内在逻辑及知识体系 5
1.4 人工智能的数学基础 9
1.4.1 人工智能的数学本质 9
1.4.2 常用的基元函数及其功能 10
1.4.3 智能函数的参数学习 14
1.4.4 学习方式 14
1.4.5 深度学习架构 17
1.5 认知科学 18
1.5.1 何谓认知科学 18
1.5.2 认知科学的研究主题 19
1.5.3 认知科学的研究方法 20
小结 21
思考题 22
第2章 自然语言处理 23
2.1 引言 23
2.2 文本分析基础 24
2.2.1 文本语义表示 25
2.2.2 文本相似度 30
2.2.3 文本相似度计算示例 33
2.3 经典自然语言处理任务 34
2.3.1 文本摘要 34
2.3.2 机器翻译 36
2.3.3 知识图谱 37
2.4 大语言模型 39
2.4.1 大语言模型背景 39
2.4.2 大语言模型的发展历程 40
2.4.3 大语言模型关键技术 44
2.4.4 代表性大语言模型 49
2.4.5 以KimiChat为例的大语言模型应用 53
小结 56
思考题 57
第3章 计算机视觉 58
3.1 引言 58
3.2 图像表示与特征提取 59
3.2.1 图像表示 59
3.2.2 特征提取 60
3.3 计算机视觉的应用 63
3.3.1 应用方向 63
3.3.2 人脸检测与特征点定位 65
3.3.3 特征表达与学习 66
3.3.4 属性识别与身份识别 67
3.3.5 安全性和公平性问题 68
3.3.6 人脸编辑与生成 68
3.4 视觉大模型 71
3.4.1 Transformer在计算机视觉中的应用:ViT 71
3.4.2 视觉大模型的发展 72
3.4.3 多模态大模型 74
3.5 计算机视觉的展望 76
小结 77
思考题 77
第4章 智能音频技术 78
4.1 引言 78
4.2 智能音频技术简介 79
4.2.1 从“声音”到“音频” 79
4.2.2 智能音频信息处理 80
4.3 音频信息识别 85
4.3.1 概述 85
4.3.2 语音识别 90
4.3.3 音频事件识别 92
4.4 音频信息检索 94
4.4.1 概述 94
4.4.2 音频信息检索方法 96
4.4.3 语音检索 98
4.4.4 音频样例检索 99
4.4.5 哼唱检索 100
4.5 音频大模型 101
4.5.1 音频大模型 101
4.5.2 音频相关多模态大模型 101
4.6 智能音频技术应用案例 102
4.6.1 智能语音助手 102
4.6.2 智能音乐创作 104
4.7 总结和展望 105
小结 106
思考题 106
第5章 机器学习基础 108
5.1 引言 108
5.2 智能函数的模型形式 110
5.2.1 机器学习中的智能函数 110
5.2.2 复合智能函数的构成 111
5.3 智能函数的自动求解算法 112
5.3.1 基于智能函数的知识获取、表示和利用 112
5.3.2 学习的数学形式 112
5.3.3 智能函数的求解算法 113
5.4 智能函数的优化目标 113
5.4.1 机器学习的评价方法 113
5.4.2 影响泛化能力的主要因素 114
5.4.3 目标函数的正则化 117
5.5 机器学习的基本范式与推理方式 118
5.5.1 机器学习的基本范式 118
5.5.2 基于数据的归纳推理 119
5.5.3 机器学习是基于统计学的归纳推理 120
5.6 机器学习基本方法 122
5.6.1 朴素贝叶斯分类器 122
5.6.2 决策树 123
5.6.3 线性模型 125
5.6.4 K近邻学习 126
5.6.5 K均值聚类算法 127
小结 129
思考题 129
第6章 深度神经网络 131
6.1 引言 131
6.2 多层感知机与神经网络 132
6.2.1 多层感知机与神经网络概述 132
6.2.2 误差反向传播法 134
6.2.3 参数的更新 140
6.3 深度神经网络的核心问题 141
6.3.1 加深网络 141
6.3.2 梯度消失和梯度爆炸问题 143
6.3.3 需要更多的数据 145
6.3.4 更快的优化算法 146
6.3.5 避免过拟合 149
6.4 注意力机制与Transformer 150
6.4.1 注意力机制 151
6.4.2 Transformer架构 154
6.4.3 Transformer的应用 157
小结 160
思考题 160
第7章 大模型:人工智能的新前沿 161
7.1 引言 161
7.2 发展历程 161
7.3 通用性和开放性 163
7.3.1 通用性 163
7.3.2 开放性 163
7.4 核心技术原理 164
7.4.1 Transformer架构 164
7.4.2 预训练—微调范式 165
7.4.3 提示学习技术 166
7.4.4 知识蒸馏 166
7.4.5 模型训练 167
7.4.6 量化和剪枝 168
7.4.7 网络架构搜索 168
7.4.8 云端部署和推理加速 169
7.5 知识工程及攻击防范 170
7.5.1 知识注入 170
7.5.2 幻觉检测与预防 171
7.5.3 人工对齐 172
7.5.4 攻击防范 174
7.6 未来发展 177
7.6.1 大模型在未来发展面临的挑战 177
7.6.2 大模型在未来发展的研究方向 178
小结 179
思考题 179
第8章 人工智能的社会角色 180
8.1 引言 180
8.2 基本定义和愿景 180
8.2.1 基本定义 180
8.2.2 愿景 181
8.3 威胁和挑战 182
8.3.1 根本背离人工智能社会角色的风险 183
8.3.2 人工智能角色作用面临的安全威胁 183
8.3.3 人工智能角色作用面临的伦理挑战 184
8.4 治理体系和防范方法 186
8.4.1 法律治理体系 186
8.4.2 技术防范方法 187
8.4.3 行政管理措施 190
小结 191
思考题 191
第9章 人工智能计算基础 193
9.1 引言 193
9.2 计算机系统 194
9.3 并行计算 196
9.3.1 计算机集群基础 197
9.3.2 分布式集群基础 199
9.4 深度学习服务器 202
9.4.1 多核CPU 202
9.4.2 GPU 203
9.4.3 昇腾AI处理器 209
9.4.4 TPU和Tensorflow 210
9.4.5 深度学习编译框架 212
9.5 云-边-端协同计算 213
9.5.1 云计算 213
9.5.2 边缘计算 218
9.5.3 智能设备 222
9.6 未来展望 225
小结 226
思考题 226
参考文献 227