深度學習 : 捲積神經網絡從入門到精通
內容描述
捲積神經網絡是深度學習中為重要的模型,對引領深度學習的井噴式發展起到了不可或缺的作用。本書試圖全面介紹捲積神經網絡的模型和方法,詳細討論了其現代雛形、突破模型、加深模型、應變模型、跨連模型、區域模型、分割模型、特殊模型和強化模型,後是其成就AlphaGo。為了輔助讀者理解有關內容,本書還結合應用案例分析了很多具體模型的代碼實現及演示效果。
目錄大綱
前言
第1章概述1
1.1深度學習的起源和發展1
1.2卷積神經網絡的形成和演變4
1.3卷積神經網絡的應用和影響6
1.4卷積神經網絡的缺陷和視圖9
1.5卷積神經網絡的GPU實現和cuDNN庫10
1.6卷積神經網絡的平台和工具10
1.7本書的內容結構和案例數據13
1.7.1內容結構13
1.7.2案例數據15
第2章預備知識22
2.1激活函數22
2.2矩陣運算23
2.3導數公式24
2.4梯度下降算法25
2.5反向傳播算法26
2.5.1通用反向傳播算法27
2.5.2逐層反向傳播算法28
2.6通用逼近定理31
2.7內外卷積運算31
2.8膨脹卷積運算32
2.9上下採樣運算33
2.10卷積面計算34
2.11池化面計算36
2.12局部響應歸一化36
2.13權值偏置初始化37
2.14丟失輸出37
2.15丟失連接38
2.16隨機梯度下降算法39
2.17塊歸一化39
2.18動態規划算法40
第3章卷積神經網絡的現代雛形——LeNet 41
3.1 LeNet的原始模型41
3.2 LeNet的標準模型43
3.3 LeNet的學習算法44
3.4 LeNet的Caffe代碼實現及說明46
3.5 LeNet的手寫數字識別案例54
3.6 LeNet的交通標誌識別案例58
3.6.1交通標誌數據集的格式轉換58
3.6.2交通標誌的識別分類60
3.7 LeNet的交通路網提取案例63
3.7.1交通路網的人工標註64
3.7.2交通路網的圖像塊分類67
3.7.3交通路網的圖像塊分類LeNet 69
3.7.4交通路網的自動提取代碼及說明71
3.7 .5交通路網的自動提取程序運行結果75
第4章卷積神經網絡的突破模型78
4.1 AlexNet的模型結構78
4.2AlexNet的Caffe代碼實現及說明82
4.3AlexNet的Caffe大規模圖像分類案例及演示效果95
4.4AlexNet的TensorFlow代碼實現及說明97
4.5AlexNet的TensorFlow大規模圖像分類案例及演示效果103
4.6 AlexNet的改進模型ZFNet 107
第5章卷積神經網絡的應變模型109
5.1 SPPNet的模型結構109
5.2SPPNet的Caffe代碼實現及說明112
5.3SPPNet的大規模圖像分類案例及演示效果114
第6章卷積神經網絡的加深模型118
6.1結構加深的捲積網絡VGGNet 118
6.1.1 VGGNet的模型結構118
6.1.2VGGNet的TensorFlow代碼實現及說明120
6.1.3VGGNet的物體圖像分類案例129
6.2結構更深的捲積網絡GoogLeNet 130
6.2.1 GoogLeNet的模型結構130
6.2.2GoogLeNet的TensorFlow代碼實現及說明136
6.2.3GoogLeNet的鮮花圖像分類案例149
第7章卷積神經網絡的跨連模型154
7.1快道網絡HighwayNet 154
7.2殘差網絡ResNet 155
7.2.1 ResNet的模型結構155
7.2.2ResNet的Caffe代碼實現及說明157
7.2.3ResNet的大規模圖像分類案例163
7.3密連網絡DenseNet 169
7.3.1 DenseNet的模型結構169
7.3.2DenseNet的Caffe代碼實現及說明171
7.3.3DenseNet的物體圖像分類案例174
7.4拼接網絡CatNet 178
7.4.1 CatNet的模型結構178
7.4.2CatNet的Caffe代碼實現及說明179
7.4.3CatNet的人臉圖像性別分類案例183
第8章卷積神經網絡的區域模型190
8.1區域卷積網絡R-CNN 190
8.2快速區域卷積網絡Fast R-CNN 191
8.3更快區域卷積網絡Faster R-CNN 193
8.3.1Faster R -CNN的模型結構193
8.3.2Faster R-CNN的TensorFlow代碼實現及說明196
8.3.3Faster R-CNN的圖像目標檢測案例及演示效果216
8.4你只看一次網絡YOLO 220
8.4.1 YOLO的模型結構220
8.4.2YOLO的TensorFlow代碼實現及說明226
8.4.3YOLO的圖像目標檢測案例及演示效果239
8.5單次檢測器SSD 242
8.5.1 SSD的模型結構242
8.5.2SSD的TensorFlow代碼實現及說明245
8.5.3SSD的圖像目標檢測案例及演示效果260
第9章卷積神經網絡的分割模型266
9.1全卷積網絡FCN 266
9.1.1 FCN的模型結構266
9.1.2FCN的Caffe代碼實現及說明269
9.1.3FCN的圖像語義和幾何分割案例272
9.2金字塔場景分析網絡PSPNet 277
9.2.1 PSPNet的模型結構277
9.2.2PSPNet的TensorFlow代碼實現及說明282
9.2.3PSPNet的圖像語義分割案例及演示效果291
9.3掩膜區域卷積網絡Mask R-CNN 294
9.3.1Mask R-CNN的模型結構294
9.3.2Mask R- CNN的Keras和TensorFlow代碼實現及說明297
9.3.3Mask R-CNN的圖像實例分割案例及演示效果318
第10章卷積神經網絡的特殊模型325
10.1孿生網絡SiameseNet 325
10.1.1SiameseNet的模型結構325
10.1. 2SiameseNet的Caffe代碼實現及說明326
10.1.3SiameseNet的手寫數字驗證案例328
10.2擠壓網絡SqueezeNet 331
10.2.1SqueezeNet的模型結構331
10.2.2SqueezeNet的Caffe代碼實現及說明334
10.2.3SqueezeNet大規模圖像分類案例337
10.3深層卷積生成對抗網絡DCGAN 339
10.3.1DCGAN的模型結構339
10.3.2DCGAN的TensorFlow代碼實現及說明340
10.3.3DCGAN的CelebA人臉圖像生成案例345
10.4網中網NIN 348
作者介紹
李玉鑑(鑑) 北京工業大學教授.博士生導師。華中科技大學本科畢業,中國科學院數學研究所碩士畢業,中國科學院半導體研究所博士畢業,北京郵電大學博士後出站。曾在中國科學院生物物理所工作,對意識的本質問題關注過多年,並在《21世紀100個交叉科學難題》上發表《揭開意識的奧秘》一文,提出了解決意識問題的認知相對論綱領,對腦計劃和類腦研究具有宏觀指導意義。長期圍繞人工智能的核心目標,在神經網絡、自然語言處理、模式識別和機器學習等領域開展教學、科研工作.發表國內外期刊、會議論文數十篇,是本書的第一作者。