书籍 驾驭文本  文本的发现、组织和处理的封面

驾驭文本 文本的发现、组织和处理

(美)英格索尔 (美)莫顿 (美)法里斯著 王斌译

出版社

北京:电子工业出版社

出版时间

2015

ISBN

9787121252303

标注页数

318 页

PDF页数

342 页

书籍介绍
文本处理是目前互联网内容应用(如搜索引擎、推荐引擎)的关键技术。本书涵盖了文本处理概念和技术的多个方面,包括文本预处理、搜索、字符串匹配、信息抽取、命名实体识别、分类、聚类、标签生成、摘要、问答等。本书的特点在于通过实例来理解文本处理的这些概念和技术,读者利用现有的开源工具就可以自己实现这些实例。
在线购买PDF电子书