深度學習與 TensorFlow 實戰
內容描述
本書主要講解深度學習和TensorFlow的實戰知識,全書分為10章,主要內容如下:第1章為深度學習概述,包括深度學習的基礎知識、深度學習的生產力實現—TensorFlow、數據模型、TensorFlow項目介紹、TensorFlow工作環境的安裝與運行;第2章為機器學習概述,講解機器學習的定義、任務、性能、經驗、學習算法、線性回歸實例和TensorFlow的完整運行腳本;第3章介紹從生物神經元到感知器的內容,講解基於MCP神經元實現布爾邏輯、感知器、使用感知器做分類等;第4章介紹人工神經網絡,講述的內容包括從感知器到多層感知器、帶有權值的MCP神經元—感知器、反向傳播神經網絡、使用人工神經網絡分類mnist;第5章介紹Logistic回歸與Softmax回歸;第6章介紹捲積神經網絡,講述感知器模式識別、捲積操作、捲積神經網絡的結構、使用TensorFlow實現捲積神經網絡的實例;第7章介紹循環神經網絡,包括循環神經網絡的特徵、有限狀態機、從MCP神經網絡到循環神經網絡等;第8章介紹LSTM循環神經網絡,包括梯度彌散現象、長短期記憶網絡、通過TensorFlow實現一個簡單的LSTM;第9章深入討論TensorFlow,講解機器學習框架、計算圖、神經網絡與計算圖、TensorFlow中的數據流圖、使用GPU、數據可視化工具TensorBoard等;第10章為TensorFlow案例實踐,包括構建TensorFlow的圖片分類系統、準備代碼和訓練集、構造模型計算圖、訓練模型、評估模型的性能、多GPU訓練等。
本書旨在幫助具有較少數學基礎並期望在深度學習上有所作為的學習者,希望為他們提供一個快速上手深度學習的實戰教程。本書適合閱讀的讀者包括相關專業的本科生或研究生,以及不具有機器學習或統計知識背景但想要快速補充深度學習知識,以便在實際產品或平臺中應用的軟件工程師。
目錄大綱
前言Ⅰ
第1章深度學習概述1
1.1人類的人工智能之夢1
1.2從遙想到實踐3
1.3三大人工智能學派3
1.3.1符號學派3
1.3.2行為學派3
1.3.3連接學派4
1.4連接學派中的神經網絡4
1.5神經網絡的“新稱謂”—深度學習7
1.6深度學習的生產力實現—
TensorFlow 8
1.6.1 TensorFlow之Tensor 9
1.6.2 TensorFlow之Flow 10
1.6.3 TensorFlow之簡單的
數據模型11
1.7 TensorFlow項目介紹13
1.8 TensorFlow工作環境的安裝和運行14
1.8.1 Ubuntu環境下基於Virtualenv的
安裝方法15
1.8.2基於Mac OS的安裝方法16
1.8.3簡單運行一下TensorFlow 16
第2章機器學習概述18
2.1什麼是機器學習18
2.1.1機器學習的定義18
2.1.2任務19
2.1.3性能20
2.1.4經驗24
2.2學習算法24
2.2.1表示25
2.2.2評價25
2.2.3優化27
2.3以線性回歸為例28
2.3.1線性回歸的任務T 28
2.3.2線性回歸的經驗E 28
2.3.3線性回歸的表示R 30
2.3.4線性回歸的評價E 30
2.3.5線性回歸的優化O 31
2.3.6小結32
2.3.7 TensorFlow的完整運行腳本33
2.4本章小結35
第3章從生物神經元到感知器36
3.1感知器的前身36
3.1.1生物神經元36
3.1.2一個基礎的神經元—
McCulloch-Pitts Units 37
3.1.3基於MCP神經元實現
布爾邏輯37
3.1.4帶有權值的MCP神經元39
3.1.5通過帶有權值的MCP神經元對
空間進行線性劃分40
3.2感知器41
3.2.1感知器簡介41
3.2.2感知器的激活函數42
3.3使用感知器分類43
3.3.1感知器的二分類43
3.3.2經驗E—Iris鳶尾花數據集44
3.3.3感知器的表示R 45
3.3.4感知器的評價E 45
3.3.5感知器的優化O 46
3.3.6實踐感知器47
3.4本章小結49
第4章人工神經網絡50
4.1從感知器到多層感知器50
4.1.1再次回到MCP神經元50
4.1.2帶有權值的MCP神經元—
感知器57
4.1.3兩層感知器形成“凸域”問題61
4.1.4非凸域優化64
4.2反向傳播神經網絡65
4.2.1一個生動的比喻65
4.2.2計算圖基礎—前向傳播66
4.2.3計算圖—帶有參數w、b的
前向傳播68
4.2.4計算圖—帶有參數w、b的
反向傳播69
4.3使用人工神經網絡對mnist數據進行
分類71
4.4本章小結73
第5章Logistic回歸與Softmax回歸74
5.1信息論74
5.1.1編碼74
5.1.2編碼效率74
5.1.3編碼代價75
5.1.4最優編碼77
5.1.5信息量和熵78
5.1.6交叉熵80
5.2 Logistic回歸81
5.2.1線性回歸回顧81
5.2.2 Logistic回歸回顧84
5.2.3 Logistic人工神經網絡稀疏化
表徵87
5.2.4 sigmoid激活函數與信息熵90
5.2.5最大熵模型91
5.3 Softmax回歸96
5.3.1從Logistic回歸到Softmax
回歸96
5.3 .2 Softmax回歸的參數冗餘96
5.3.3 Softmax回歸與Logistic回歸的
關係97
5.3.4 Softmax回歸與k個二元
分類器98
5.4本章小結98
第6章卷積神經網絡99
6.1感知器模式識別99
6.1.1通過感知器識別一幅簡單的
圖像99
6.1.2感知器的魯棒性101
6.1.3生物視神經與感受野103
6.1.4 Minsky感知器與
局部感受野105
6.1.5從魯賓杯角度理解
局部感受野108
6.1.6單個感知器模式識別的
局限性110
6.1.7多層感知器的模式識別112
6.2卷積操作116
6.2.1卷積的數學定義116
6.2.2局部感受野與卷積116
6.2.3卷積操作的用途118
6.3卷積神經網絡的結構119
6.3.1卷積操作中局部感受野的
跨度120
6.3.2白邊122
6.3.3池化操作123
6.3.4卷積神經網絡的層級結構124
6.3.5通過卷積神經網絡處理彩色
圖像的模型126
6.4使用TensorFlow實現卷積神經網絡的
小例子129
6.5本章小結131
第7章循環神經網絡132
7.1循環神經網絡:一種循環的人工
神經網絡132
7.1.1回到黑箱模型132
7.1.2時間序列性134
7.2有限狀態機135
7.2.1有限狀態機的布爾邏輯135
7.2.2有限狀態機的結構136
7.3從MCP神經網絡到循環神經網絡138
7.3.1 MCP神經網絡與有限
狀態機的等效性138
7.3.2前饋神經網絡與MCP
神經網絡的等效性140
7.3.3循環神經網絡與前饋
神經網絡的等效性142
7.3.4循環神經網絡的描述145
7.3.5循環神經網絡的參數學習—
BPTT 147
7.4本章小結151
第8章LSTM循環神經網絡152
8.1梯度彌散現象152
8.1.1梯度彌散的緣由152
8.1.2梯度彌散帶來的“健忘” 155
8.2長短期記憶網絡157
8.2.1 LSTM的結構157
8.2.2 LSTM單元如何緩解
梯度彌散161
8.3通過TensorFlow實現一個
簡單的LSTM 162
8.4本章小結165
第9章深入TensorFlow 166
9.1機器學習框架回顧166
9.2計算圖167
9.2.1計算圖的前饋計算167
9.2 .2計算圖的反饋計算168
9.3神經網絡與計算圖170
9.3.1神經網絡與計算圖的轉換170
9.3.2神經網絡計算圖的前饋計算與
反饋計算172
9.4 TensorFlow中的數據流圖176
9.4 .1張量176
9.4.2操作177
9.4.3變量和占位符178
9.4.4三段式編程179
9.4.5會話180
9.5使用GPU 183
9.5.1單機CPU+GPU 183
9.5.2單機CPU+多GPU 184
9.5.3分佈式計算185
9.6數據可視化工具TensorBoard 188
9.6.1生成靜態計算圖188
9.6.2統計動態數據流190
9.6.3使用TensorBoard實現訓練
可視化190
9.7本章小結193
第10章TensorFlow案例實踐194
10.1構建TensorFlow的圖片分類系統194
10.2準備代碼和訓練集195
10.3構造模型計算圖199
10.4訓練模型207
10.5評估模型的性能210
10.6多GPU訓練213
10.7本章小結218
作者介紹
李建軍
對深度學習和Tensorflow概念和工具都有著很深的理解和研究,
開發了一系列的案例,並在教學實踐加以應用。有著豐富的實戰經驗、
以及應用Tensorflow和深度學習的項目背景。