第1章 语料库语言学概述 1
1.1 语料库的定义 1
1.2 语料库的类型 2
1.3 语料库的加工 3
1.3.1 语料库的加工层次 3
1.3.2 语料库的标注原则 5
1.3.3 语料库的加工技术 6
1.4 语料库的应用 6
1.4.1 频率统计 6
1.4.2 词汇研究 7
1.4.3 语言教学 7
思考与练习 7
第2章 汉语语料库建设的基本步骤 8
2.1 规划:确定类型 8
2.2 设计:制定原则 9
2.2.1 通用性原则 9
2.2.2 描述性原则 10
2.2.3 实用性原则 10
2.2.4 抽样性原则 10
2.3 选材:操作原则 11
2.3.1 语料分类 11
2.3.2 语料年限 12
2.3.3 语料描述 13
2.3.4 语料样本 13
2.3.5 语料版权 14
2.4 建库:语料录入 15
2.5 标注:语料加工 16
思考与练习 18
第3章 汉语语料库建设的加工规范 19
3.1 名词 20
3.1.1 普通名词 21
3.1.2 时间名词 22
3.1.3 方位名词 23
3.1.4 处所名词 23
3.1.5 人名 24
3.1.6 地名 24
3.1.7 团体机构名 25
3.1.8 其他专有名词 25
3.2 动词 25
3.3 形容词 26
3.4 区别词 27
3.5 数词 27
3.6 量词 28
3.7 副词 28
3.8 代词 28
3.9 介词 29
3.10 连词 29
3.11 助词 30
3.12 叹词 30
3.13 拟声词 30
3.14 习用语 30
3.15 缩略语 31
3.16 前接成分 31
3.17 后接成分 31
3.18 语素字 32
3.19 非语素字 32
3.20 其他 32
3.21 关于重叠式的切分与标注 33
思考与练习 33
第4章 汉语语料库建设的词表研制 34
4.1 词表结构与组成 34
4.2 词表的构造原则 37
4.3 词表的操作依据 37
4.4 词表的主要问题 38
4.4.1 对“词”的认识不清 38
4.4.2 对词表的要求不同 38
4.4.3 现行切词规范存在问题 38
4.4.4 没有规范词表 39
4.4.5 对词表问题认识不清 39
4.5 结构化词表理论 39
思考与练习 40
第5章 汉语语料库中的词频研究 41
5.1 词频统计的意义与困难 41
5.2 选材、抽样、录入 41
5.3 切词、统计 43
5.4 小结 43
思考与练习 44
第6章 汉语语料库中的句频研究 45
6.1 《现代汉语基本句型》 45
6.2 标准句型系统 48
6.3 句型统计系统的组成与结构 48
6.4 汉语句型的自动分析 49
6.5 句型自动分析和统计 49
6.6 实验结果与分析 50
思考与练习 50
附:常用句型频度表 50
第7章 基于语料库的对外汉语词典编纂 57
7.1 字头收字范围 57
7.2 例句用字范围 57
7.3 释义用字范围 58
7.4 字头义项 62
思考与练习 62
附:527个释义用字 62
第8章 基于语料库的汉语词语搭配研究 64
8.1 搭配的相关研究 64
8.2 搭配的计算 65
8.3 实验结果及其讨论 65
思考与练习 69
第9章 基于语料库的汉语语法研究 70
9.1 语料库数据作为论证的部分论据 70
9.2 语料库数据作为论证的全部论据 75
思考与练习 79
第10章 基于语料库的小学语文教材研究 80
10.1 《小蝌蚪找妈妈》用字的统计 80
10.2 《小蝌蚪找妈妈》用字差异标注 83
10.3 《小蝌蚪找妈妈》用字差异类型 85
10.4 《小蝌蚪找妈妈》的用字问题讨论 85
思考与练习 86
附:本章参考的小学语文教材列表 86
第11章 基于语料库的对外汉语教材研究 88
11.1 超纲词的判定 88
11.2 超纲词的统计 89
11.3 超纲词与超纲字 93
11.4 超纲词研究的意义 94
11.5 小结 94
思考与练习 95
第12章 基于语料库的对外汉语教学研究 96
12.1 引言:另类中介语 96
12.2 另类中介语研究的步骤 96
12.3 另类中介语统计与分析 97
12.4 小结 104
思考与练习 104
第13章 基于语料库的对外汉语教材编写 105
13.1 引言 105
13.2 素材选择 105
13.3 课文排序 106
13.4 生词处理 107
13.5 语法讲解 108
13.6 小结 108
思考与练习 108
第14章 如何统计汉语语料的字频 109
14.1 引言 109
14.2 获取网络原始语料电子文本 109
14.3 原始语料的初步处理 110
14.4 合并文本文件的处理 117
14.5 汉字次数与字频统计 118
14.6 汉字累计频率统计 122
14.7 字频统计结果 123
14.8 小结 123
思考与练习 124
第15章 如何比较两个词表的异同 125
15.1 引言 125
15.2 使用IF函数比较两个词表的异同 125
15.3 使用条件格式比较两个词表的异同 129
15.4 通过VBA编程比较两个词表的异同 132
15.5 通过Word文档比较两个词表的异同 135
15.6 结语 137
思考与练习 137
第16章 如何处理免费公开的语料 138
16.1 北语语料库检索界面简介 138
16.2 北语语料库检索功能简介 139
16.3 免费公开语料的具体处理 146
思考与练习 152
参考文献 153
扩展阅读文献 158