自然語言處理技術入門與實戰

自然語言處理技術入門與實戰

作者: 蘭紅雲
出版社: 電子工業
出版在: 2017-11-01
ISBN-13: 9787121327636
ISBN-10: 7121327635
裝訂格式: 平裝
總頁數: 200 頁





內容描述


《自然語言處理技術入門與實戰》內容提要
《自然語言處理技術入門與實戰》主要從語義模型詳解、自然語言處理系統基礎算法和系統案例實戰三個方面,介紹了自然語言處理中相關的一些技術。對於每一個算法又分別從應用原理、數學原理、代碼實現,以及對當前方法的思考四個方面進行講解。
《自然語言處理技術入門與實戰》面向的讀者為有志於從事自然語言處理相關工作的在校學生、企事業單位工作人員等人群。本書的結構是由淺入深地進行相關內容的介紹,以滿足不同層次讀者的學習需求。

海報:


目錄大綱


第1篇語義模型詳解
第1章關鍵詞抽取模型3 
1.1 TF-IDF算法實現關鍵詞抽取4 
1.2 TextRank算法實現關鍵詞抽取11 
1.3基於語義的統計語言模型實現關鍵詞抽取16 
第2章短語抽取模型22 
2.1基於互信息和左右信息熵實現短語抽取23 
2.2 TextRank算法實現短語抽取28 
2.3 LDA算法實現短語抽取31 
第3章自動摘要抽取模型38 
3.1決策樹算法實現自動摘要39 
3.2基於邏輯回歸算法實現自動摘要44 
3.3貝葉斯算法實現自動摘要50 
第4章深度學習——計算任意詞距離模型55 
4.1 FP-Growth算法實現詞距離計算56 
4.2 N-Gram算法實現詞距離計算61 
4.3 BP算法實現詞距離計算65 
第5章拼音漢字混合識別模型70 
5.1貝葉斯模型實現拼音漢字混合識別71 
5.2 HMM模型實現拼音漢字混合識別75 
5.3 RNN神經網絡模型實現拼音漢字混合識別80
 
第6章文本自動生成模型87 
6.1基於關鍵詞的文本自動生成模型88 
6.2 RNN模型實現文本自動 成93 
第2篇自然語言處理系統基礎算法
第7章Dijkstra算法101 
7.1算法應用原理介紹102 
7.2算法數學原理介紹102 
7.3算法源碼說明106 
7.4算法應用擴展107 
第8章AC-DoubleArrayTrie算法108 
8.1算法應用原理介紹109 
8.2算法數學原理介紹111 
8.3算法應用擴展116 
第9章最大熵算法117 
9.1算法應用原理介紹118 
9.2算法數學原理介紹119 
9.3算法源碼說明124 
9.4算法應用擴展125 
第10章CRF算法126 
10.1算法應用原理介紹127 
10.2算法數學原理介紹130 
10.3算法源碼說明135 
10.4算法應用擴展136 
第11章馬爾可夫邏輯網算法137 
11.1算法應用原理介紹138 
11.2算法數學原理介紹142 
11.3算法源碼說明144 
11.4算法應用擴展145 
第12章DIPRE算法147 
12.1算法應用原理介紹148 
12.2算法數學原理介紹151 
12.3算法源碼說明152 
12.4算法應用擴展153
第13章LSTM算法155 
13.1算法應用原理介紹156 
13.2算法數學原理介紹158 
13.3算法源碼說明163 
13.4算法應用擴展165 
第14章TransE算法166 
14.1算法應用原理介紹167 
14.2算法數學原理介紹170 
14.3算法源碼說明172 
14.4算法應用擴展174 
第3篇系統案例實戰
第15章搭建輿情分析與挖掘的系統177 
15.1系統功能設計簡述178 
15.2系統模塊實現詳解181 
15.3系統實現源碼說明186


作者介紹


蘭紅雲,湖北襄陽人。
曾任職於獵豹移動,現為阿里影業數據挖掘專家,擁有多年的算法和數據挖掘的工作經驗,申請過多項算法專利。
研究方向包括自然語言處理和機器學習。




相關書籍

Data Mining and Machine Learning in Building Energy Analysis

作者 Frederic Magoules Hai-Xiang Zhao

2017-11-01

Practical Web Scraping for Data Science: Best Practices and Examples with Python

作者 Seppe vanden Broucke

2017-11-01

Foundational Python for Data Science

作者 Behrman Kennedy

2017-11-01