第一篇 体系 3
第1章 绪论 3
1.1 引言 3
1.2 关于agent的翻译 3
1.3 人工智能的定义 4
1.4 人工智能的基础 5
1.4.1 数学 6
1.4.2 经济学 8
1.4.3 神经科学 9
1.4.4 认知心理学 9
1.4.5 控制理论与控制论 10
1.5 人工智能的历史 11
1.5.1 人工智能的孕育和诞生 12
1.5.2 人工智能的黄金年代 13
1.5.3 人工智能的第一个冬天 14
1.5.4 人工智能的第一次繁荣 15
1.5.5 人工智能的第二个冬天 16
1.5.6 人工智能的第二次繁荣 16
1.6 人工智能的突破 17
1.6.1 计算机游戏 17
1.6.2 计算机视觉 20
1.6.3 语音识别 21
1.6.4 机器翻译 21
1.6.5 自动驾驶 22
6.6 人工大脑 22
1.6.7 人工智能芯片 23
1.6.8 医学人工智能 23
1.6.9 药物人工智能 24
1.6.10 法律人工智能 24
1.7 人工智能的判定 25
1.7.1 图灵测试 25
1.7.2 图灵测试的解读 26
1.7.3 图灵测试2.0 27
1.7.4 中文房间 34
1.8 人工智能的层级 35
1.8.1 人工专用智能 35
1.8.2 人工通用智能 36
1.8.3 人工超级智能 37
1.9 人工智能的安全 38
1.10 人工智能的应用 40
1.11 小结 40
习题 40
第2章 体系论 42
2.1 引言 42
2.2 人工智能的研究途径 42
2.2.1 控制论与人工智能 42
2.2.2 符号与亚符号 43
2.2.3 整齐与不整齐 44
2.2.4 逻辑与反逻辑 45
2.2.5 符号主义、联结主义与行为主义 46
2.2.6 概率与统计方法 47
2.2.7 计算心理学、计算哲学与机器智能 47
2.2.8 经典与现代人工智能 48
2.3 人工智能的主体论点 48
2.3.1 智能主体 49
2.3.2 计算主体 51
2.3.3 理性主体 52
2.4 智能主体的环境 53
2.5 智能主体的构成 54
2.5.1 主体函数 54
2.5.2 主体算法 54
2.5.3 主体结构 55
2.6 人工智能的研究体系 56
2.6.1 人工智能的本源 56
2.6.2 人工智能的内涵 57
2.6.3 人工智能的外延 57
2.6.4 人工智能的体系 58
2.7 智能主体的思维 59
2.7.1 求解 59
2.7.2 规划 60
2.7.3 学习 60
2.7.4 推理 61
2.8 智能主体的交互 62
2.8.1 感知 62
2.8.2 动作 63
2.9 智能主体的类型 63
2.9.1 主体的层次 63
2.9.2 求解型主体 64
2.9.3 规划型主体 65
2.9.4 学习型主体 66
2.9.5 推理型主体 66
2.10 小结 67
习题 67
第二篇 求解 71
第3章 搜索问题求解 71
3.1 引言 71
3.2 搜索问题 71
3.1.1 智力游戏问题 71
3.1.2 现实世界问题 74
3.3 搜索问题的要素 74
3.3.1 状态表征 74
3.3.2 状态空间 75
3.3.3 形式化 75
3.3.4 求解的方法 76
3.4 搜索问题的实例化 77
3.4.1 八数码难题 77
3.4.2 八皇后难题 77
3.4.3 传教士和食人族问题 78
3.4.4 最短路径问题 78
3.5 搜索求解的方式 79
3.5.1 树搜索 79
3.5.2 图搜索 80
3.6 无信息搜索 81
3.6.1 宽度优先搜索 82
3.6.2 深度优先搜索 84
3.6.3 迭代深化搜索 85
3.7 有信息搜索 86
3.7.1 统一代价搜索 87
3.7.2 贪婪最佳优先搜索 88
3.7.3 A搜索 90
3.8 小结 91
习题 91
第4章 优化问题求解 92
4.1 引言 92
4.2 优化问题 92
4.2.1 智力游戏问题 93
4.2.2 现实世界问题 93
4.3 优化问题的求解 94
4.3.1 局部搜索 94
4.3.2 元启发式 95
4.3.3 群体智能 95
4.4 局部搜索方法 95
4.4.1 爬山法 96
4.4.2 局部束搜索 98
4.5 元启发式方法 99
4.5.1 禁忌搜索 100
4.5.2 模拟退火算法 103
4.5.3 遗传算法 105
4.6 群体智能方法 108
4.6.1 蚁群优化算法 108
4.6.2 粒子群优化算法 110
4.7 小结 112
习题 112
第5章 博弈问题求解 114
5.1 引言 114
5.2 博弈问题 114
5.2.1 智力游戏问题 114
5.2.2 现实世界问题 115
5.3 博弈问题的类型 116
5.3.1 合作与非合作 116
5.3.2 零和与非零和 117
5.3.3 完美与不完美信息 117
5.3.4 对称与非对称 117
5.3.5 随机与非随机 118
5.3.6 同步与顺序 118
5.4 博弈算法的历史 118
5.5 博弈问题的求解 121
5.5.1 博弈问题的复杂性 121
5.5.2 对抗搜索 122
5.5.3 博弈策略 122
5.6 完美信息博弈 123
5.6.1 最小最大策略 124
5.6.2 Alpha-Beta剪枝 130
5.6.3 蒙特卡罗树搜索 132
5.6.4 AlphaGo的博弈算法 137
5.7 不完美信息博弈 139
5.7.1 纳什均衡与相关均衡 139
5.7.2 不完美信息博弈示例 141
5.7.3 遗憾最小化 145
5.7.4 虚拟遗憾最小化 147
5.7.5 DeepStack 150
5.7.6 Libratus 151
5.8 非对称博弈 154
5.8.1 非对称博弈概述 154
5.8.2 非对称博弈的对称分解 155
5.9 随机博弈 156
5.9.1 随机博弈概述 156
5.9.2 随机博弈模型 156
5.10 小结 158
习题 158
第6章 约束问题求解 160
6.1 引言 160
6.2 约束问题 160
6.2.1 智力游戏问题 160
6.2.2 现实世界问题 163
6.3 可能世界及其约束 163
6.3.1 可能世界 163
6.3.2 变量与值域 164
6.3.3 约束 164
6.4 约束满足问题 165
6.4.1 形式化 165
6.4.2 状态的表示 166
6.4.3 求解的方法 167
6.5 约束满足问题的实例化 167
6.5.1 数独 167
6.5.2 算式谜 168
6.5.3 地图着色 169
6.5.4 作业调度 170
6.6 约束传播 171
6.6.1 节点一致性 171
6.6.2 弧一致性 172
6.6.3 路径一致性 173
6.6.4 k-一致性 173
6.7 回溯搜索 173
6.7.1 回溯搜索的实例 174
6.7.2 回溯搜索算法 175
6.7.3 回溯算法的细化 175
6.8 局部搜索 178
6.8.1 最少冲突启发式 178
6.8.2 约束加权法 179
6.9 问题的结构 180
6.9.1 独立子问题 180
6.9.2 树结构问题 180
6.10 问题的改进 182
6.10.1 动态约束满足问题 183
6.10.2 柔性约束满足问题 183
6.10.3 分散约束满足问题 184
6.11 小结 184
习题 184
第三篇 规划 189
第7章 时空关联规划 189
7.1 引言 189
7.2 规划问题 189
7.2.1 智力游戏问题 189
7.2.2 现实世界问题 191
7.3 规划语言 191
7.4 经典规划 192
7.4.1 经典规划的定义 192
7.4.2 状态空间规划 193
7.4.3 计划空间规划 195
7.4.4 经典规划的分析 201
7.5 新经典规划 202
7.5.1 规划图技法 202
7.5.2 命题可满足性技法 209
7.5.3 逻辑演绎技法 210
7.5.4 约束满足技法 211
7.6 时序规划 211
7.6.1 时序参照及其关系 211
7.6.2 时序算子方法 212
7.6.3 纪事方法 215
7.7 规划与调度 219
7.7.1 调度问题的要素 220
7.7.2 设备调度问题 222
7.7.3 规划与调度的整合 224
7.8 运动规划 229
7.8.1 几何表示与转换 229
7.8.2 位姿空间 232
7.8.3 栅格运动规划 233
7.8.4 采样运动规划 234
7.8.5 组合运动规划 236
7.9 小结 238
习题 239
第8章 决策理论规划 240
8.1 引言 240
8.2 决策理论规划概述 240
8.3 马尔科夫模型 241
8.3.1 随机过程 242
8.3.2 马尔科夫性质 242
8.3.3 马尔科夫过程 243
8.3.4 马尔科夫决策过程 245
8.3.5 隐马尔科夫模型 246
8.3.6 部分可观测马尔科夫决策过程 246
8.4 马尔科夫决策过程的优化控制 246
8.4.1 策略 247
8.4.2 奖惩与折扣 247
8.4.3 价值函数 248
8.4.4 贝尔曼公式 249
8.4.5 优化控制方法 250
8.5 动态规划 251
8.5.1 策略迭代 251
8.5.2 价值迭代 254
8.5.3 异步动态规划 256
8.5.4 广义策略迭代 257
8.6 小结 259
习题 259
第四篇 学习 263
第9章 三个视角 263
9.1 引言 263
9.2 机器学习概述 263
9.2.1 机器学习的由来 263
9.2.2 学习的主要类型 265
9.2.3 机器学习与人工智能 266
9.2.4 机器学习与相关研究领域 267
9.3 可能近似正确学习 268
9.4 没有免费午餐定理 270
9.5 机器学习的历史 272
9.5.1 神经网络 272
9.5.2 决策树 275
9.5.3 提升算法 276
9.5.4 支撑向量机 278
9.5.5 强化学习 280
9.6 机器学习的难点 282
9.7 机器学习的视角 283
9.7.1 学习任务 284
9.7.2 学习范式 285
9.7.3 学习框架 285
9.8 小结 286
习题 286
第10章 学习的任务 288
10.1 引言 288
10.2 学习任务概述 288
10.3 分类 289
10.3.1 定义 289
10.3.2 工作原理 290
10.3.3 线性与非线性 291
10.3.4 类别与维度 293
10.3.5 案例分析 295
10.3.6 应用领域 296
10.4 回归 297
10.4.1 定义 297
10.4.2 工作原理 297
10.4.3 线性与非线性 299
10.4.4 案例分析 300
10.4.5 应用领域 301
10.5 聚类 302
10.5.1 定义 302
10.5.2 工作原理 303
10.5.3 主要途径 304
10.5.4 案例分析 308
10.5.5 应用领域 309
10.6 排名 309
10.6.1 定义 309
10.6.2 工作原理 309
10.6.3 主要途径 310
10.6.4 案例分析 311
10.6.5 应用领域 311
10.7 降维 312
10.7.1 定义 312
10.7.2 工作原理 313
10.7.3 线性与非线性 313
10.7.4 案例分析 319
10.7.5 应用领域 321
10.8 小结 321
习题 322
第11章 学习的范式 323
11.1 引言 323
11.2 学习范式概述 323
11.3 监督学习 325
11.3.1 定义 325
11.3.2 形式化描述 326
11.3.3 对应的学习任务 327
11.3.4 其他关联范式 328
11.4 无监督学习 329
11.4.1 定义 329
11.4.2 对应的学习任务 330
11.4.3 重要性 330
11.4.4 其他途径 332
11.5 强化学习 335
11.5.1 定义 335
11.5.2 强化学习的类型 335
11.5.3 蒙特卡罗方法 337
11.5.4 时序差分方法 340
11.5.5 适格录迹 343
11.5.6 深度强化学习 346
11.5.7 强化学习算法比较 349
11.6 其他范式 350
11.6.1 学会学习 350
11.6.2 迁移学习 351
11.6.3 集成学习 351
11.6.4 对抗学习 351
11.6.5 协同学习 352
11.7 范式与任务的关系 353
11.8 小结 353
习题 354
第12章 学习的框架 355
12.1 引言 355
12.2 学习框架概述 355
12.3 概率框架 356
12.3.1 什么是概率框架 356
12.3.2 生成与判别模型 358
12.3.3 概率图模型 358
12.3.4 案例分析 360
12.4 统计框架 362
12.4.1 什么是统计框架 362
12.4.2 参数模型 362
12.4.3 非参数模型 363
12.4.4 案例分析 363
12.5 几何框架 364
12.5.1 什么是几何框架 364
12.5.2 超平面 364
12.5.3 流形 365
12.5.4 案例分析 366
12.6 联结框架 367
12.6.1 什么是联结框架 367
12.6.2 人工神经网络 367
12.6.3 浅层与深层 368
12.6.4 前馈与反馈 372
12.6.5 单主体与多主体 374
12.6.6 案例分析 375
12.7 逻辑框架 377
12.7.1 什么是逻辑框架 377
12.7.2 基于逻辑 377
12.7.3 基于规则 378
12.7.4 案例分析 382
12.8 小结 383
习题 384
第五篇 推理 387
第13章 知识表示 387
13.1 引言 387
13.2 知识与表征 387
13.2.1 数据、信息、知识与智慧 387
13.2.2 知识的类型 388
13.2.3 显性与隐性 389
13.2.4 知识系统 389
13.2.5 知识表示 390
13.3 知识表示的历史 390
13.4 可能世界理论 394
13.4.1 可能世界 394
13.4.2 三种观点 394
13.4.3 六个命题 395
13.4.4 三种性质 395
13.5 知识表示的范式 396
13.5.1 确定性与不确定性 396
13.5.2 过程性与陈述性 397
13.5.3 开放世界与封闭世界假设 397
13.6 确定性知识表示 397
13.6.1 语义网络 398
13.6.2 框架 399
13.6.3 经典逻辑 401
13.6.4 模态逻辑 404
13.6.5 描述逻辑 406
13.6.6 本体 410
13.6.7 资源描述框架 414
13.6.8 知识图谱 415
13.7 不确定性知识表示 416
13.7.1 贝叶斯网络 418
13.7.2 可能性理论 422
13.7.3 证据理论 424
13.8 小结 425
习题 426
第14章 推理机制 427
14.1 引言 427
14.2 推理问题 428
14.2.1 智力游戏问题 428
14.2.2 现实世界问题 428
14.3 推理模式 429
14.3.1 演绎推理 429
14.3.2 归纳推理 430
14.3.3 溯因推理 431
14.3.4 推理模式浅析 431
14.4 逻辑推理 432
14.4.1 关于逻辑推理 432
14.4.2 前向链接 433
14.4.3 后向链接 434
14.5 定性推理 436
14.5.1 关于定性推理 436
14.5.2 定性表示 437
14.5.3 定性推理技术 439
14.6 本体推理 440
14.6.1 关于本体推理 440
14.6.2 本体语言 441
14.6.3 语义推理器 443
14.7 概率推理 445
14.7.1 关于概率推理 445
14.7.2 频率论推理 446
14.7.3 贝叶斯推理 446
14.7.4 贝叶斯网络推理 447
14.7.5 随机仿真近似推理 450
14.8 机器推理 453
14.8.1 关于机器推理 453
14.8.2 神经模块网络推理 454
14.8.3 组合注意网络推理 455
14.9 推理的应用 456
14.10 小结 457
习题 457
全书参考文献 458