深度學習計算機視覺實戰

深度學習計算機視覺實戰

作者: 肖鈴 劉東
出版社: 電子工業
出版在: 2021-11-01
ISBN-13: 9787121417597
ISBN-10: 7121417596
裝訂格式: 平裝
總頁數: 300 頁





內容描述


本書是一本看懂電腦視覺的實戰指南,使用理論與實踐相結合的思想,真正一站式搞定理論學習、算法開發到模型部署上線。 全書內容共分為四個部分。第一部分包括第1、2章,主要講解深度學習和電腦視覺基礎,如電腦視覺領域的經典網絡和常見的目標檢測算法;第二部分包括第3~6章,主要講解圖像處理知識,結合應用案例,對知識點進行分析說明;第三部分包括第7~11章,主要講解電腦視覺中的實戰項目,對實現細節做了追本溯源的講解;第四部分包括第12~13章,主要講解模型的落地部署,該部分的講解基於TensorFlow Lite框架,該框架受眾廣、熱度高,且在各種平臺都有對應的支持與優化加速方案,方便讀者使用。 本書中的上百個知識點與50多個案例都是作者工程應用中的經驗總結,每章末尾均有"進階必備”,給讀者提供更多的拓展知識。本書適合電腦視覺的初學者、電腦視覺算法開發人員、對深度學習有興趣的用戶或者亟須工程落地使用的用戶,也適合作為高校相關專業的學生教材使用。


目錄大綱


第1章 深度學習基礎 1
1.1 神經網絡 1
1.1.1 感知機 1
1.1.2 神經網絡原理 2
1.2 卷積神經網絡 3
1.2.1 CNN基本操作 3
1.2.2 CNN原理 6
1.3 循環神經網絡 7
1.3.1 RNN 7
1.3.2 LSTM與GRU 8
1.4 經典網絡 9
1.4.1 AlexNet 9
1.4.2 VGG 10
1.4.3 GoogLeNet 11
1.4.4 ResNet 12
1.4.5 MobileNet 13
1.5 進階必備:如何學習深度學習並“落地”求職 16
1.5.1 深度學習如何快速入門 16
1.5.2 深度學習行業求職技巧 17
第2章 計算機視覺基礎 18
2.1 目標檢測Two-stage算法 18
2.1.1 R-CNN算法 18
2.1.2 Fast R-CNN算法 20
2.1.3 Faster R-CNN算法 21
2.2 目標檢測One-stage算法 23
2.2.1 YOLO系列算法 23
2.2.2 SSD算法 29
2.3 圖像分割算法 31
2.3.1 FCN算法 31
2.3.2 U-Net算法 33
2.3.3 DeepLab系列算法 34
2.3.4 Mask R-CNN算法 37
2.4 進階必備:計算機視覺方向知多少 38
第3章 基礎圖像處理 40
3.1 線性濾波 40
3.1.1 案例1:使用方框濾波 41
3.1.2 案例2:使用均值濾波 46
3.1.3 案例3:使用高斯濾波 48
3.2 非線性濾波 50
3.2.1 案例4:使用中值濾波例 50
3.2.2 案例5:使用雙邊濾波 52
3.3 OpenCV形態學運算 54
3.3.1 案例6:進行膨脹操作 55
3.3.2 案例7:進行腐蝕操作 57
3.3.3 案例8:使用形態學運算 58
3.4 案例9:使用漫水填充 63
3.5 圖像金字塔 67
3.5.1 案例10:使用高斯金字塔 67
3.5.2 案例11:使用拉普拉斯金字塔 70
3.6 閾值化 73
3.6.1 案例12:使用基本閾值 74
3.6.2 案例13:使用自適應閾值 78
3.7 進階必備:選擇一款合適的圖像處理工具 80
3.7.1 OpenCV 80
3.7.2 Matlab 81
第4章 圖像變換 83
4.1 邊緣檢測 83
4.1.1 案例14:Sobel算法 83
4.1.2 案例15:Scharr算法 87
4.1.3 案例16:Laplacian算法 90
4.1.4 案例17:Canny算法 91
4.2 案例18:繪製輪廓 94
4.3 霍夫變換 97
4.3.1 案例19:霍夫線變換 97
4.3.2 案例20:霍夫圓變換 101
4.4 案例21:重映射 103
4.5 案例22:仿射變換 106
4.6 案例23:透視變換 109
4.7 直方圖 111
4.7.1 案例24:直方圖的計算與繪製 111
4.7.2 案例25:直方圖均衡化 113
4.8 進階必備:圖像變換應用之文本圖像矯正 114
4.8.1 圖像變換知識總結 114
4.8.2 案例26:文本圖像矯正 115
第5章 角點檢測 117
5.1 案例27:Harris角點檢測 117
5.2 案例28:Shi-Tomasi角點檢測 119
5.3 案例29:亞像素級角點檢測 122
5.4 進階必備:角點檢測知識總結 125
第6章 特徵點檢測與匹配 127
6.1 特徵點檢測 127
6.1.1 opencv-contrib環境安裝 127
6.1.2 案例30:SIFT特徵點檢測 130
6.1.3 案例31:SURF特徵點檢測 137
6.2 特徵匹配 139
6.2.1 案例32:BruteForce匹配 139
6.2.2 案例33:FLANN匹配 146
6.3 案例34:ORB特徵提取 148
6.4 進階必備:利用特徵點拼接圖像 151
6.4.1 特徵點檢測算法彙總 151
6.4.2 案例35:基於特徵點檢測與匹配的圖像拼接 151
第7章 手寫數字識別 155
7.1 Keras的應用 155
7.1.1 Keras模型 155
7.1.2 Keras層 156
7.1.3 模型編譯 157
7.1.4 模型訓練 158
7.2 LeNet算法 159
7.3 案例36:使用Keras實現手寫數字識別 160
7.3.1 模型訓練 160
7.3.2 手寫數字識別模型推理 164
7.4 進階必備:算法模型開發流程 167
7.4.1 數據準備 167
7.4.2 網絡搭建 169
7.4.3 模型訓練 170
第8章 CIFAR-10圖像分類 171
8.1 圖像分類數據集 171
8.1.1 CIFAR-10數據集和CIFAR-100數據集 171
8.1.2 ImageNet數據集 172
8.1.3 PASCAL VOC數據集 173
8.2 案例37:CIFAR-10圖像分類 173
8.2.1 模型訓練過程 174
8.2.2 模型推理 179
8.3 進階必備:COCO數據集與使用HOGTSVM方法實現圖像分類 180
8.3.1 COCO數據集 180
8.3.2 案例38:使用HOG+SVM方法實現圖像分類 180
第9章 驗證碼識別 184
9.1 TensorFlow應用 184
9.1.1 案例39:TensorFlow的基本使用 184
9.1.2 TensorFlow的常用模塊 186
9.2 案例40:驗證碼識別 188
9.2.1 生成驗證碼圖片 188
9.2.2 基於TensorFlow的驗證碼識別 189
9.3 進階必備:算法模型開發技巧 194
9.3.1 數據預處理技巧 194
9.3.2 網絡搭建技巧 195
9.3.3 模型訓練技巧 196
第10章 文本檢測實戰 197
10.1 文本檢測算法 197
10.1.1 CTPN算法 198
10.1.2 EAST算法 200
10.2 案例41:基於EAST算法的文本檢測 202
10.2.1 數據預處理 202
10.2.2 網絡搭建 205
10.2.3 模型訓練 212
10.2.4 文本檢測驗證 217
10.3 進階必備:在不同場景下文本檢測的應對方式 218
10.3.1 複雜場景文本檢測 219
10.3.2 案例42:使用形態學運算實現簡單場景文本檢測 220
10.3.3 案例43:使用MSER+NMS實現簡單場景文本檢測 223
第11章 文本識別實戰 226
11.1 文本識別算法 226
11.1.1 CRNN算法 226
11.1.2 Attention OCR算法 229
11.2 案例44:基於C-RNN算法的文本識別 231
11.2.1 數據預處理 231
11.2.2 網絡搭建 232
11.2.3 模型訓練 236
11.2.4 文本識別驗證 237
11.3 進階必備:單字OCR 238
11.3.1 OCR探究 238
11.3.2 案例45:文本圖片字符切割 238
第12章 TensorFlow Lite 244
12.1 TensorFlow Lite介紹 244
12.1.1 TensorFlow Lite基礎 245
12.1.2 TensorFlow Lite源碼分析 246
12.2 模型轉換 248
12.2.1 FlatBuffers文件格式 248
12.2.2 案例46:其他格式轉換為. tflite模型 250
12.3 模型量化 252
12.3.1 案例47:量化感知訓練 252
12.3.2 案例48:訓練後量化 255
12.4 進階必備:模型轉換與模型部署優化答疑 257
12.4.1 模型轉換問題 257
12.4.2 模型部署優化 258
第13章 基於TensorFlow Lite的AI功能部署實戰 260
13.1 部署流程 260
13.2 案例49:移動端部署 261
13.2.1 搭建開發環境 262
13.2.2 編譯運行項目 262
13.2.3 調用過程解析 264
13.3 PC端部署 266
13.3.1 案例50:Windows端部署 266
13.3.2 案例51:Linux端部署 278
13.3.3 案例52:ARM平台部署 282
13.3.4 案例53:MIPS平台部署 285
13.4 進階必備:推理框架拓展與OpenCV編譯部署 286
13.4.1 其他深度學習推理框架 286
13.4.2 OpenCV編譯 286


作者介紹


肖鈴,碩士,現任南方海洋科學與工程廣東省實驗室工程師。
2016年畢業於中國科學技術大學與中國科學院合肥物質科學研究院安徽光機所大氣光學研究中心,曾就職於中興通訊股份有限公司和珠海金山辦公軟件有限公司,長期從事圖像處理、深度學習計算機視覺算法,以及基於TensorFlow Lite的AI模型部署研究。
劉東,研究員,博士生導師。
現任中國科學院合肥物質科學研究院安徽光機所大氣光學研究中心副主任,曾在美國懷俄明大學大氣科學係做博士後。
主要從事大氣光學和激光雷達大氣探測研究工作,是國際激光大氣探測協會(ICLAS)中國唯一委員,SKYNET國際委員會中國委員,安徽省氣象學會副理事長。




相關書籍

Python程序設計案例教程——從入門到機器學習(微課版)

作者 張思民

2021-11-01

Applied Meta-Analysis with R and Stata

作者 Chen Ding-Geng (Din) Peace Karl E.

2021-11-01

R語言數據可視化實戰

作者 米霖

2021-11-01