罗刚,张子宪,崔智杰编著2017 年出版398 页ISBN:9787302469360
全书以零基础的读者自学完成一个中文分词系统作为目标。从Java基础语法开始,然后到文本处理相关的数据结构和算法,最后实现文本切分和词性标注。本书是唯一介绍业界热门的Java开发中文分词的书籍。...
张世博著2019 年出版207 页ISBN:9787517069263
目前,大数据产业蓬勃发展,从而带动了人们对于非格式化文本数据的分析需求,本书全面、系统的介绍了文本信息处理的相关技术,包括分词、文本向量化、特征选择、文本相似度计算、文本分类、主题模型、情感计算等内...