輕鬆學自然語言處理-電腦這樣理解語言 (學AI真簡單系列3)
內容描述
本書特色
透過本書,可以:
•了解自然語言處理(NLP)的概念
•了解各種自然語言處理的方法
•如何使用循環神經網路(RNN)、長短期記憶法(LSTM)對句子進行情緒分析
•如何使用RNN、LSTM對句子內的詞標註詞性
內容簡介
本書有系統地介紹了自然語言處理(NLP)的基礎技術,從傳統的統計處理方法過渡到近年興起基於類神經網路的處理方法,用通俗易懂的語言說明自然語言處理的概念,於各章節中也都有配合實際範例描述所介紹的方法,讓讀者有更紮實的理解。內容深入淺出、容易理解,相信本書會讓讀者有所收獲。
本書作者為AI4kids團隊,曾應教育部國教署邀請,至全國高中主任會議分享AI教學、親子天下雜誌專文報導,成員來自AIA台灣人工智慧學校的校友,團隊有軟體技術、創新研發、工程管理、電商行銷等資歷專長,因為對AI科技教育的熱情而投入AI的教案研發與教學,目標是透過教孩子動手實作AI專題,來啟發他們對好奇心與想像力,協助他們運用各種程式或平台工具來探索、創造自己的AI應用。
目錄大綱
第1章 自然語言處理介紹
1-1 前言
1-2 何謂「自然語言處理」?
1-3 傳統的自然語言處理
1-4 深度學習的自然語言處理
1-5 小結
第2章 電腦學中文的第一步:斷詞
2-1 前言
2-2 語料庫
2-3 最大匹配法
2-4 斷詞工具
2-5 中文斷詞工具──Jieba
2-6 中研院斷詞系統─CKipTagger
2-7 小結
第3章 基於統計的自然語言處理
3-1 前言
3-2 One-hot表示法
3-3 詞袋表示法
3-4 TF-IDF表示法
3-5 N元語法
3-6 小結
第4章 基於類神經的自然語言處理
4-1 前言
4-2 詞嵌入
4-3 國王–他 + 她 = 皇后
4-4 Skip-gram模型與CBOW模型
4-5 訓練詞彙向量
4-6 小結
第5章 循環神經網路簡介
5-1 前言
5-2 認識序列資料
5-3 類神經網路的演進
5-4 循環神經網路
5-5 循環神經網路的種類
5-6 長短期記憶神經網路
5-7 小結
第6章 RNN與LSTM實作:IMDB情緒分析
6-1 前言
6-2 載入與了解IMDB網路電影資料集
6-3 資料預處理
6-4 建構RNN及LSTM模型
6-5 小結
第7章 RNN與LSTM實作:詞性標註
7-1 前言
7-2 載入與了解詞性標註資料集
7-3 資料預處理
7-4 建立字典
7-5 獲得訓練集與測試集
7-6 TensorFlow data pipeline
7-7 建構RNN及LSTM模型
7-8 小結
附錄A Python基礎語法查詢表
A-1 Python基本概念
附錄B Google Colab使用簡介
B-1 Google Colaboratory介紹
B-2 Notebook組態設定
B-3 檢視目前Python版本與套件清單