第2版与第1版的区别
结合近几年Python的发展情况和广大读者的反馈意见,本书在保留第1版特色的基础上,进行全面的升级。第2版修订的主要内容如下。
• 将Python由Python 3.6.0升级为Python 3.11.7;将Anaconda由Anaconda3 4.4.0升级为 Anaconda3 2024.02-1。
• 在每一章中新增了素养目标和思维导图。
• 第1章新增了构建中文文本高频词云图的任务。
• 第2章删去了NLTK库的介绍,新增了中文开源语料库的介绍,并使用构建电影评论语料库的任务替换原本的构建作品集语料库的任务。
• 第3章新增了常用正则表达式搭配。
• 第4章删去了n-gram模型以及隐马尔可夫模型的理论推导部分,新增了基于深度学习的分词的介绍,以及正向最大匹配法的示例、双向最大匹配法的示例和HMM中文分词的任务。
• 第5章删去了词性标注规范和CRF模型的理论部分(只保留结构图和对应介绍),新增了词性标注模型的介绍(基于HMM的词性标注和基于深度学习的词性标注)和基于CRF模型的中文命名实体识别的介绍。
• 第6章删去了LSA算法与LDA算法的理论部分,新增了LSA算法与LDA算法的示例。
• 第7章删去了Word2Vec模型的理论部分,新增了TF-IDF方法的介绍和示例、CBoW模型实现中文文本向量化的示例、Skip-Gram模型实现中文文本向量化的示例、DM模型实现文本向量化的示例与DBoW模型实现文本向量化的示例。
• 第8章新增了文本分类的应用和文本聚类的应用的介绍与示例。
• 第9章删去了基于LDA的情感分析,新增了文本情感分析的主要内容和相应的示例。
• 第10章删去了RNN语言模型的理论部分(只保留结构图和对应介绍)和工具介绍部分。
• 新增了第12章大语言模型。
我要评论