自然語言處理技術入門與實戰
內容描述
《自然語言處理技術入門與實戰》內容提要
《自然語言處理技術入門與實戰》主要從語義模型詳解、自然語言處理系統基礎算法和系統案例實戰三個方面,介紹了自然語言處理中相關的一些技術。對於每一個算法又分別從應用原理、數學原理、代碼實現,以及對當前方法的思考四個方面進行講解。
《自然語言處理技術入門與實戰》面向的讀者為有志於從事自然語言處理相關工作的在校學生、企事業單位工作人員等人群。本書的結構是由淺入深地進行相關內容的介紹,以滿足不同層次讀者的學習需求。
海報:
目錄大綱
第1篇語義模型詳解
第1章關鍵詞抽取模型3
1.1 TF-IDF算法實現關鍵詞抽取4
1.2 TextRank算法實現關鍵詞抽取11
1.3基於語義的統計語言模型實現關鍵詞抽取16
第2章短語抽取模型22
2.1基於互信息和左右信息熵實現短語抽取23
2.2 TextRank算法實現短語抽取28
2.3 LDA算法實現短語抽取31
第3章自動摘要抽取模型38
3.1決策樹算法實現自動摘要39
3.2基於邏輯回歸算法實現自動摘要44
3.3貝葉斯算法實現自動摘要50
第4章深度學習——計算任意詞距離模型55
4.1 FP-Growth算法實現詞距離計算56
4.2 N-Gram算法實現詞距離計算61
4.3 BP算法實現詞距離計算65
第5章拼音漢字混合識別模型70
5.1貝葉斯模型實現拼音漢字混合識別71
5.2 HMM模型實現拼音漢字混合識別75
5.3 RNN神經網絡模型實現拼音漢字混合識別80
第6章文本自動生成模型87
6.1基於關鍵詞的文本自動生成模型88
6.2 RNN模型實現文本自動 成93
第2篇自然語言處理系統基礎算法
第7章Dijkstra算法101
7.1算法應用原理介紹102
7.2算法數學原理介紹102
7.3算法源碼說明106
7.4算法應用擴展107
第8章AC-DoubleArrayTrie算法108
8.1算法應用原理介紹109
8.2算法數學原理介紹111
8.3算法應用擴展116
第9章最大熵算法117
9.1算法應用原理介紹118
9.2算法數學原理介紹119
9.3算法源碼說明124
9.4算法應用擴展125
第10章CRF算法126
10.1算法應用原理介紹127
10.2算法數學原理介紹130
10.3算法源碼說明135
10.4算法應用擴展136
第11章馬爾可夫邏輯網算法137
11.1算法應用原理介紹138
11.2算法數學原理介紹142
11.3算法源碼說明144
11.4算法應用擴展145
第12章DIPRE算法147
12.1算法應用原理介紹148
12.2算法數學原理介紹151
12.3算法源碼說明152
12.4算法應用擴展153
第13章LSTM算法155
13.1算法應用原理介紹156
13.2算法數學原理介紹158
13.3算法源碼說明163
13.4算法應用擴展165
第14章TransE算法166
14.1算法應用原理介紹167
14.2算法數學原理介紹170
14.3算法源碼說明172
14.4算法應用擴展174
第3篇系統案例實戰
第15章搭建輿情分析與挖掘的系統177
15.1系統功能設計簡述178
15.2系統模塊實現詳解181
15.3系統實現源碼說明186
作者介紹
蘭紅雲,湖北襄陽人。
曾任職於獵豹移動,現為阿里影業數據挖掘專家,擁有多年的算法和數據挖掘的工作經驗,申請過多項算法專利。
研究方向包括自然語言處理和機器學習。