自然语言处理

中国水利水电出版社

【作者】主编　冯建周

【I S B N 】978-7-5226-0527-2

【责任编辑】石永峰

【适用读者群】本专通用

【出版时间】2022-04-12

【开本】16开

【装帧信息】平装（光膜）

【版次】第1版第1次印刷

【页数】256

【千字数】409

【印张】16

【定价】￥48

【丛书】普通高等教育人工智能专业系列教材

【备注信息】

图书详情

简介

本书特色

前言

章节列表

精彩阅读

下载资源

相关图书

自然语言处理是人工智能的重要分支，本书是一本自然语言处理的入门教材，主要面向高年级本科生和低年级研究生。本着理论结合实践的基本原则，本书共分为11章，其中第1章概述了自然语言处理的研究内容、发展历程、技术特色和当前现状，是概述性的一章。第2章是自然语言处理的编程基础，对Python语言及其相关模块进行了介绍。第3章是自然语言处理的算法基础，主要对常见的机器学习算法（分类算法、聚类算法、概率图模型、集成学习、人工神经网络等）进行了讲解。第4～5章从统计学方法入手讲解了自然语言处理的两个基础任务：分词和关键词抽取。第6章则讲解了当前流行的词向量技术，尤其是Word2vec和大规模预训练模型BERT。第7～11章分别对当前自然语言处理的热门研究领域展开讲解，包括文本分类、信息抽取、机器阅读理解、文本生成和摘要抽取、对话和聊天系统等。

本书除了可以作为高等院校计算机、大数据和人工智能及其相关专业的本科生和研究生教材外，也可供对自然语言处理技术感兴趣的研究人员和工程技术人员参考。

结构合理

针对课程特点及学生学习需求安排结构，使理论与实践相辅相成、紧密结合。

内容新颖

聚焦当前的研究热点，引入深度学习算法解决多种自然语言处理问题。

资源丰富

配有微课视频、提供相关代码包，充分利用线上资源优势，辅助知识理解。

自然语言处理是人工智能的重要分支，自然语言处理技术是体现人工智能技术发展程度的一个重要衡量尺度。伴随着人工智能在几十年间的几度沉浮，自然语言处理技术的发展势头也同样经历着多次的高潮与低谷。当前，随着新一代人工智能技术的蓬勃发展，自然语言处理技术也迎来了一个前所未有的发展高峰期，尤其在21世纪前后，统计学习方法被作为主要技术手段应用在自然语言处理中，并在多个领域取得了革命性的进步。进入到21世纪的第二个十年以后，随着对深度学习的研究，以及新型的词向量技术的出现，尤其是大规模自监督预训练模型的出现，自然语言处理技术在很多领域得到了快速发展，并逐渐进入成熟的商业应用，先后在智能搜索引擎、信息抽取、对话与聊天系统以及文本生成等领域进入开花落地阶段。

随着自然语言处理技术的快速发展，自然语言处理得到业界越来越多的关注，越来越多的相关书籍纷纷问世，从笔者的角度来看，这些书籍可根据面向的人群分为两类：一类是面向行业从业人员，这类书籍更加注重实践环节，对理论着笔比重较低；另一类是面向研究生以上学历的学习者，这类书籍更加偏重理论部分的讲解，对实践环节着墨较少。笔者认为，随着自然语言处理技术的快速普及，也可以开设面向高年级本科生和低年级研究生的相关课程，而面向这类人群的教材应该做到理论和实践并重，同时理论部分又需要适当精简，做到深入浅出；而实践部分则需要紧扣理论，以验证性实践项目为主，不宜过于复杂，通过恰当的案例让学生加深对理论的理解，同时培养学生的实践动手能力。从这个角度出发，笔者开始酝酿并编写这样一本教材。

本书从四个层面介绍自然语言处理技术，首先对自然语言处理技术的发展历程、技术特点以及当前的研究现状进行概述。第二个层面主要是讲述自然语言处理技术的两个基础：编程基础和算法基础。在第2章讲解了自然语言处理技术的编程基础，由于当前Python语言已经成为自然语言处理技术的主流编程语言，因此在这一章主要对Python的语法特点和自然语言处理技术中常用的相关模块进行了讲解，对于不了解Python编程语言的学生，可以利用这一章补齐短板；对于已经具备编程基础的学生，则可以直接跳过。第3章系统介绍了自然语言处理技术的算法基础，包含常用的机器学习算法，例如分类算法、聚类算法、人工神经网络模型等。对于没有算法基础的学生来讲，这一章可以很好地补充基础算法知识，为下面进入自然语言处理相关领域奠定算法基础。对于已经掌握了这些基础算法的学生来讲，则可以直接跳过此章。第三个层面主要讲解了基于统计学习方法的自然语言处理技术的一些基础任务，例如分词技术、关键词抽取技术等。第四个层面则是从词向量模型开始讲起，从Word2vec到大规模预训练模型BERT，以及在此基础上结合最新的深度学习算法的自然语言处理研究领域，例如文本分类技术、信息抽取技术、机器阅读理解技术、文本生成和摘要抽取技术以及对话和聊天系统等。本书相关代码详见https://github.com/nlpresearchers/nlpbook。

在本书的筹备和编写过程中，冯建周负责全书的结构设计和统稿审校工作，具体章节负责人如下：第1章由冯建周编写，第2章由王文龙编写，第3章由于浩洋编写，第4～6章由余扬和王琴编写，第7章由冯建周和徐甘霖编写，第8章由冯建周、崔金满和魏启凯编写，第9章由魏永辉和刘锁阵编写，第10章由魏永辉和任重灿编写，第11章由魏永辉和龙景编写。

由于编写时间仓促和编者水平限制，书中难免存在错误、疏漏之处，望读者包涵，批评指正。

前言
第1章　自然语言处理概述 1
1.1　自然语言处理的定义 1
1.2　自然语言处理的应用领域 1
1.3　自然语言处理的发展历程 4
1.4　自然语言处理的研究现状和发展趋势 5
1.5　自然语言处理的知识和技术储备 6
本章小结 7
第2章　自然语言处理编程基础 8
2.1　Python基础 8
2.1.1　Python语言概述 8
2.1.2　Python基础知识 9
2.2　NumPy和Pandas的使用 15
2.2.1　NumPy的使用 16
2.2.2　Pandas的使用 20
2.3　深度学习框架PyTorch 27
2.3.1　PyTorch简介及环境搭建 27
2.3.2　PyTorch入门 28
本章小结 34
第3章　机器学习算法基础 35
3.1　分类算法 35
3.1.1　朴素贝叶斯模型 35
3.1.2　决策树模型 37
3.1.3　支持向量机模型 38
3.1.4　逻辑回归模型 39
3.2　聚类算法 41
3.2.1　原型聚类 41
3.2.2　密度聚类 42
3.2.3　层次聚类 43
3.3　模型评估与选择 44
3.3.1　经验误差与过拟合 44
3.3.2　评估方法 45
3.3.3　性能度量 47
3.4　概率图模型 49
3.4.1　隐马尔可夫模型（HMM） 49
3.4.2　条件随机场模型 50
3.4.3　LDA模型 53
3.5　集成学习 53
3.5.1　个体与集成 53
3.5.2　XGboost模型 54
3.5.3　Bagging和随机森林 55
3.6　人工神经网络与深度学习 55
3.6.1　人工神经网络与深度学习概述 55
3.6.2　BP神经网络 56
3.6.3　卷积神经网络（CNN） 58
3.6.4　循环神经网络（RNN）与LSTM 59
本章小结 61
第4章　中文分词 62
4.1　基于词表的分词算法 62
4.1.1　正向最大匹配算法 63
4.1.2　逆向最大匹配算法 63
4.1.3　双向最大匹配算法 64
4.1.4　案例实现 65
4.2　基于统计模型的分词算法 68
4.2.1　N-gram模型 69
4.2.2　基于N-gram模型的分词算法 69
4.2.3　案例实现 70
4.3　基于序列标注的分词算法 74
4.3.1　序列标注下的隐马尔可夫模型 74
4.3.2　基于隐马尔可夫模型进行中文分词 75
4.3.3　维特比（Viterbi）算法 76
4.3.4　其他基于序列标注的分词算法 77
4.3.5　案例实现 77
4.4　中文分词工具 80
4.4.1　常见的中文分词工具 80
4.4.2　Jieba分词 80
4.4.3　案例实现 82
本章小结 83
第5章　关键词提取 84
5.1　TextRank关键词提取算法 85
5.1.1　PageRank算法 85
5.1.2　TextRank算法 86
5.1.3　案例实现 87
5.2　TF-IDF关键词提取算法 89
5.2.1　评估词的重要性的常见指标 90
5.2.2　TF-IDF算法 90
5.2.3　案例实现 92
本章小结 95
第6章　词向量技术 96
6.1　词向量技术发展历程 96
6.1.1　词向量概述 96
6.1.2　词向量的发展历程 96
6.2　Word2vec 107
6.2.1　Word2vec的基本原理 107
6.2.2　Word2vec的两种训练模型 107
6.2.3　Word2vec的两种优化方法 110
6.2.4　案例实现 111
6.3　注意力机制 112
6.3.1　Encoder-Decoder框架 112
6.3.2　注意力机制概述 113
6.3.3　注意力机制的发展 116
6.4　BERT预训练模型 118
6.4.1　Transformer模型 118
6.4.2　BERT模型 121
6.4.3　案例实现 125
本章小结 126
第7章　文本分类 127
7.1　文本分类概述 127
7.2　基于朴素贝叶斯的文本分类方法 128
7.2.1　基于朴素贝叶斯算法的文本分类流程 128
7.2.2　案例实现 129
7.3　基于深度学习的文本分类 131
7.3.1　基于卷积神经网络的文本分类 131
7.3.2　案例实现 131
7.4　开放领域文本分类 134
7.4.1　开放领域文本分类简介 134
7.4.2　案例实现 135
本章小结 139
第8章　文本信息抽取 140
8.1　命名实体识别 140
8.1.1　命名实体识别概述 140
8.1.2　基于LSTM的命名实体识别 142
8.1.3　细粒度命名实体识别 146
8.2　实体关系抽取 151
8.2.1　关系抽取概述 151
8.2.2　基于卷积神经网络的关系抽取算法 152
8.2.3　实体关系的联合抽取算法 156
8.3　事件抽取 162
8.3.1　事件抽取概述 162
8.3.2　事件检测 163
8.3.3　事件元素抽取 168
本章小结 174
第9章　机器阅读理解 175
9.1　机器阅读理解概述 175
9.2　抽取式阅读理解 177
9.2.1　抽取式阅读理解概述 177
9.2.2　基于BiDAF的抽取式阅读理解案例 178
9.2.3　基于预训练模型的抽取式阅读理解 181
9.3　选择式阅读理解 183
9.3.1　选择式阅读理解概述 183
9.3.2　基于Co-Match的选择式阅读理解案例 184
9.3.3　基于预训练模型的选择式阅读理解 187
本章小结 188
第10章　文本生成与文本摘要 190
10.1　文本生成与文本摘要概述 190
10.2　抽取式文本摘要 192
10.2.1　传统方法 193
10.2.2　基于RNN的抽取式文本摘要 194
10.2.3　基于预训练模型的抽取式文本摘要 195
10.3　生成式文本摘要 196
10.3.1　早期的Seq2Seq模型 197
10.3.2　Seq2Seq+Attention模型 197
10.3.3　指针生成网络 198
10.3.4　预训练模型+微调 199
10.4　文本摘要案例 201
10.4.1　文本摘要常用数据集 201
10.4.2　使用TextRank进行简单的抽取式摘要 201
10.4.3　使用预训练模型进行文本摘要 203
本章小结 205
第11章　对话系统 206
11.1　任务型对话系统 206
11.1.1　模块化方法 206
11.1.2　自然语言理解（NLU） 207
11.1.3　对话状态跟踪（DST） 210
11.1.4　对话策略学习（DPL） 211
11.1.5　自然语言生成（NLG） 212
11.2　闲聊对话系统 213
11.2.1　检索式对话系统 214
11.2.2　粗排模型 215
11.2.3　精排模型 216
11.2.4　检索式对话系统实现 218
11.3　基于PyTorch框架的对话系统实战 221
11.3.1　数据准备和模块加载 222
11.3.2　加载和预处理数据 223
11.3.3　创建词典 226
11.3.4　为模型准备数据 229
11.3.5　定义模型 231
11.3.6　定义训练步骤 235
11.3.7　训练迭代 235
11.3.8　评估定义 237
11.3.9　评估文本 238
11.3.10　运行模型 239
11.3.11　模型训练 240
11.3.12　运行评估 241
本章小结 242
参考文献 243

课件及教学大纲
源代码

关闭

打印