自然語言處理實踐
內容描述
本書融合統計學、語言學等知識,以“讓電腦能夠確切理解人類的語言,並自然地與人進行交互”為**目標,研究能夠實現人與電腦之間用自然語言進行溝通的系列理論與技術。本書兼具基礎理論與編程實戰,可作為高等院校電腦、信息技術等相關專業的高年級本科生或研究生的實踐教材或參考書,也可供從事自然語言處理、數據挖掘和人工智能等領域研究的相關人員參考,是一本實用性極強的入門實踐教輔材料。
目錄大綱
目錄
第1章自然語言處理概述
實踐一: 隨機數生成與排序
實踐二: 99乘法表
實踐三: “海量”文件遍歷
實踐四: 文本詞頻分析
實踐五: 百度百科數據爬取
實踐六: 百度百科數據預處理
第2章文本表示
實踐七: 基於Word2vec的語言模型實踐
實踐八: 基於ERNIE語言模型的文本語義匹配
實踐九: 基於PaddleNLP的短文本相似度計算
第3章文本分類
實踐十: 基於FNN網絡的電影評論情感分析
實踐十一: 基於LSTM網絡的謠言檢測
實踐十二: 基於PaddleHub的低俗文本審核
第4章信息抽取
實踐十三: 基於LSTM的命名實體識別
實踐十四: 基於BiLSTM+CRF的事件抽取
實踐十五: 基於BiLSTM的關系抽取
第5章機器翻譯
實踐十六: 基於序列到序列模型的中英機器翻譯
實踐十七: 基於註意力機制的中英機器翻譯
實踐十八: 基於Transformer的中英機器翻譯
第6章自動文摘
實踐十九: 基於註意力機制的英文新聞標題生成
實踐二十: 基於Transformer的英文自動文摘
實踐二十一: 基於ERNIEGEN的中文自動文摘
第7章機器閱讀理解
實踐二十二: 基於SQuAD的機器閱讀理解
實踐二十三: 基於BiDAF的機器閱讀理解
實踐二十四: 基於預訓練——微調的機器閱讀理解
第8章聊天機器人設計與實現
實踐二十五(一): 聊天機器人模塊實現
實踐二十五(二): 聊天機器人系統評測
參考文獻