第1章 Web查询处理概述 1
1.1 搜索引擎工作原理 2
1.2 Web查询处理简介 4
1.3 相关研究现状 7
1.3.1 查询分类 7
1.3.2 查询意图理解 9
1.3.3 查询消歧 11
1.3.4 查询推荐 14
本章小结 15
本章参考文献 15
第2章 基于概念知识的Web查询分类 22
2.1 研究背景 22
2.2 相关工作 23
2.2.1 短文本分类 24
2.2.2 查询推荐 24
2.3 预备知识 25
2.4 基于概念的短文本分类框架 26
2.4.1 类别概念模型 27
2.4.2 短文本概念化 28
2.4.3 分类与排序 30
2.5 面向MSN新闻频道的查询分类 31
2.5.1 新闻频道的概念表示 31
2.5.2 查询概念化 33
2.5.3 查询多样化排序 33
2.6 实验 34
2.6.1 实验数据 35
2.6.2 查询分类效果 36
2.6.3 多样化推荐效果 39
本章小结 42
本章参考文献 43
第3章 基于概念知识的Web查询理解 46
3.1 介绍 46
3.2 总体框架 50
3.2.1 框架 50
3.2.2 大规模分类学知识库 51
3.3 意图停用词表 52
3.4 概念模式挖掘 53
3.4.1 实体修饰关系 54
3.4.2 概念修饰关系 55
3.5 语义角色标注 58
3.5.1 实体识别 58
3.5.2 双实体查询标注 58
3.5.3 多实体查询标注 59
3.5.4 语义冲突 60
3.6 实验 61
3.6.1 挖掘意图停用词 62
3.6.2 挖掘实体修饰关系 63
3.6.3 概念模式知识库 64
3.6.4 语义标注效果 66
3.6.5 与其他方法的比较 68
3.6.6 评分函数和参数的影响 71
3.6.7 广告匹配应用效果 73
3.7 相关工作 74
本章小结 75
本章参考文献 75
第4章 CQA问题查询的命名实体消歧 79
4.1 研究背景 79
4.2 相关工作 81
4.2.1 正规文本的实体消歧 81
4.2.2 短文本实体消歧 81
4.2.3 基于话题模型的消歧方法 82
4.3 问题定义 82
4.4 问题查询的命名实体消歧 84
4.4.1 实体指称识别 85
4.4.2 实体消歧模型 86
4.4.3 估计先验分布 89
4.4.4 模型求解 90
4.5 实验 93
4.5.1 实验设置 93
4.5.2 参数调整 96
4.5.3 评测结果 96
4.5.4 讨论 98
本章小结 100
本章参考文献 100
第5章 基于大规模实体网络的相关实体查询推荐 104
5.1 研究背景 104
5.2 相关工作 107
5.2.1 开放域的信息抽取 107
5.2.2 实体排序 108
5.2.3 查询推荐 108
5.3 相关实体网络 109
5.3.1 构建相关实体网络 109
5.3.2 相关实体网络概况 110
5.3.3 实体相关度排序 111
5.4 面向实体查询的推荐 113
5.4.1 实验数据 114
5.4.2 相关实体质量分析 114
5.4.3 排序方法评测 115
5.4.4 相关实体排序准确率 117
5.4.5 相关实体推荐新颖性 118
本章小结 120
本章参考文献 120