深度學習之 PyTorch 實戰電腦視覺
內容描述
《深度學習之PyTorch實戰電腦視覺》內容提要
電腦視覺、自然語言處理和語音識別是目前深度學習領域很熱門的三大應用方向,《深度學習之PyTorch實戰電腦視覺》旨在幫助零基礎或基礎較為薄弱的讀者入門深度學習,達到能夠獨立使用深度學習知識處理電腦視覺問題的水平。通過閱讀本書,讀者將學到人工智能的基礎概念及Python 編程技能,掌握PyTorch 的使用方法,學到深度學習相關的理論知識,比如捲積神經網絡、循環神經網絡、自動編碼器,等等。在掌握深度學習理論和編程技能之後,讀者還會學到如何基於PyTorch 深度學習框架實戰電腦視覺。《深度學習之PyTorch實戰電腦視覺》中的大量實例可讓讀者在循序漸進地學習的同時,不斷地獲得成就感。
《深度學習之PyTorch實戰電腦視覺》面向對深度學習技術感興趣、但是相關基礎知識較為薄弱或者零基礎的讀者。
目錄大綱
目錄
第1章淺談人工智能、神經網絡和計算機視覺1
1.1人工還是智能1
1.2人工智能的三起兩落2
1.2.1兩起兩落2
1.2.2捲土重來3
1.3神經網絡簡史5
1.3. 1生物神經網絡和人工神經網絡5
1.3.2 MP模型6
1.3.3感知機的誕生9
1.3.4你好,深度學習10
1.4計算機視覺11
1.5深度學習+ 12
1.5.1圖片分類12
1.5.2圖像的目標識別和語義分割13
1.5.3自動駕駛13
1.5.4圖像風格遷移14
第2章相關的數學知識15
2.1矩陣運算入門15
2.1.1標量、向量、矩陣和張量15
2.1.2矩陣的轉置17
2.1.3矩陣的基本運算18
2.2導數求解22
2.2.1一階導數的幾何意義23
2.2.2初等函數的求導公式24
2.2.3初等函數的和、差、積、商求導26
2.2.4複合函數的鍊式法則27
第3章深度神經網絡基礎29
3.1監督學習和無監督學習29
3.1.1監督學習30
3.1.2無監督學習32
3.1.3小結33
3.2欠擬合和過擬合34
3.2.1欠擬合34
3.2.2過擬合35
3.3後向傳播36
3.4損失和優化38
3.4.1損失函數38
3.4.2優化函數39
3.5激活函數42
3.5.1 Sigmoid 44
3.5.2 tanh 45
3.5.3 ReLU 46
3.6本地深度學習工作站47
3.6.1 GPU和CPU 47
3.6.2配置建議49
第4章卷積神經網絡51
4.1卷積神經網絡基礎51
4.1.1卷積層51
4.1.2池化層54
4.1.3全連接層56
4.2 LeNet模型57
4.3 AlexNet模型59
4.4 VGGNet模型61
4.5 GoogleNet 65
4.6 ResNet 69
第5章Python基礎72
5.1 Python簡介72
5.2 Jupyter Notebook 73
5.2.1 Anaconda的安裝與使用73
5.2.2環境管理76
5.2.3環境包管理77
5.2.4 Jupyter Notebook的安裝79
5.2.5 Jupyter Notebook的使用80
5.2.6 Jupyter Notebook常用的快捷鍵86
5.3 Python入門88
5.3.1 Python的基本語法88
5.3.2 Python變量92
5.3.3常用的數據類型94
5.3.4 Python運算99
5.3.5 Python條件判斷語句107
5.3.6 Python循環語句109
5.3.7 Python中的函數113
5.3.8 Python中的類116
5.4 Python中的NumPy 119
5.4.1 NumPy的安裝119
5.4.2多維數組119
5.4.3多維數組的基本操作125
5.5 Python中的Matplotlib 133
5.5.1 Matplotlib的安裝133
5.5.2創建圖133
第6章PyTorch基礎142
6.1 PyTorch中的Tensor 142
6.1.1 Tensor的數據類型143
6.1.2 Tensor的運算146
6.1.3搭建一個簡易神經網絡153
6.2自動梯度156
6.2.1 torch.autograd和Variable 156
6.2.2自定義傳播函數159
6.3模型搭建和參數優化162
6.3.1 PyTorch之torch.nn 162
6.3.2 PyTorch之torch.optim 167
6.4實戰手寫數字識別169
6.4. 1 torch和torchvision 170
6.4.2 PyTorch之torch.transforms 171
6.4.3數據預覽和數據裝載173
6.4.4模型搭建和參數優化174
第7章遷移學習180
7.1遷移學習入門180
7.2數據集處理181
7.2. 1驗證數據集和測試數據集182
7.2.2數據預覽182
7.3模型搭建和參數優化185
7.3.1自定義VGGNet 185
7.3.2遷移VGG16 196
7.3.3遷移ResNet50 203
7.4小結219
第8章圖像風格遷移實戰220
8.1風格遷移入門220
8.2 PyTorch圖像風格遷移實戰222
8.2.1圖像的內容損失222
8.2.2圖像的風格損失223
8.2.3模型搭建和參數優化224
8.2.4訓練新定義的捲積神經網絡226
8.3小結232
第9章多模型融合233
9.1多模型融合入門233
9.1.1結果多數表決234
9.1.2結果直接平均236
9.1.3結果加權平均237
9.2 PyTorch之多模型融合實戰239
9.3小結246
第10章循環神經網絡247
10.1循環神經網絡入門247
10.2 PyTorch之循環神經網絡實戰249
10.3小結257
第11章自動編碼器258
11.1自動編碼器入門258
11.2 PyTorch之自動編碼實戰259
11.2.1通過線性變換實現自動編碼器模型260
11.2.2通過卷積變換實現自動編碼器模型267
11.3小結273
作者介紹
唐進民,深入理解深度學習與計算機視覺知識體系,有紮實的PyTorch、Python和數學功底。
長期活躍於Github、知乎等平台並分享與深度學習相關的文章,具有一定的閱讀量和人氣。此前還在某AI網絡教育平台兼職Mentor,輔導新學員入門機器學習和深度學習。