電腦視覺與深度學習實戰:以MATLAB、Python為工具

電腦視覺與深度學習實戰:以MATLAB、Python為工具

作者: 劉衍琦 詹福宇 王德建
出版社: 電子工業
出版在: 2019-10-01
ISBN-13: 9787121374838
ISBN-10: 7121374838





內容描述


本書詳細講解了36個電腦視覺與深度學習實戰案例(含可運行程序),涉及霧霾去噪、答題卡自動閱捲、肺部圖像分割、小波數字水印、圖像檢索、人臉二維碼識別、車牌定位及識別、霍夫曼圖像壓縮、手寫數字識別、英文字符文本識別、眼前節組織提取、全景圖像拼接、小波圖像融合、基於語音識別的音頻信號模擬燈控、路面裂縫檢測識別、視頻運動估計追蹤、Simulink圖像處理、胸片及肝臟分割、基於深度學習的汽車目標檢測、基於電腦視覺的自動駕駛應用、基於深度學習的視覺場景識別、基於深度特徵的以圖搜畫、基於CNN的字符識別、基於CNN的物體識別、基於CNN的圖像矯正、基於LSTM的時間序列分析、基於深度學習的以圖搜圖技術、基於YOLO的智能交通目標檢測等多項重要技術及應用,涵蓋了數字圖像處理中幾乎所有的基本模塊,並延伸到了深度學習理論及其應用方面。工欲善其事,必先利其器,本書對每個數字圖像處理的知識點都提供了豐富、生動的案例素材,並以MATLAB、Python為工具詳細講解了實驗的核心程序。通過對這些程序的閱讀、理解和模擬運行,讀者可以更加深刻地理解圖像處理的內容,並且更加熟練地掌握電腦視覺及深度學習在不同實際領域中的用法。本書以案例為基礎,結構佈局緊湊,內容深入淺出,實驗簡捷高效,適合電腦、信號通信和自動化等相關專業的教師、本科生、研究生,以及廣大從事數字圖像處理的工程研發人員閱讀參考。


目錄大綱


第1章基於直方圖優化的圖像去霧技術1
1.1案例背景1
1.2理論基礎1
1.2.1空域圖像增強1
1.2.2直方圖均衡化2
1.3程序實現3
1.3.1設計GUI界面4
1.3.2全局直方圖處理4
1.3.3局部直方圖處理6
1.3.4 Retinex增強處理8
1.4延伸閱讀12
 
第2章基於形態學的權重自適應圖像去噪13
2.1案例背景13
2.2理論基礎14
2.2.1圖像去噪的方法14
2.2.2數學形態學的原理15
2.2.3權重自適應的多結構形態學去噪15
2.3程序實現16
2.4延伸閱讀22
 
第3章基於多尺度形態學提取眼前節組織24
3.1案例背景24
3.2理論基礎25
3.3程序實現28
3.3.1多尺度結構設計28
3.3.2多尺度邊緣提取29
3.3.3多尺度邊緣融合31
3.4延伸閱讀33
 
第4章基於Hough變化的答題卡識別34
4.1案例背景34
4.2理論基礎34
4.2.1圖像二值化35
4.2.2傾斜校正35
4.2.3圖像分割38
4.3程序實現40
4.3.1圖像灰度化40
4.3.2灰度圖像二值化41
4.3.3圖像平滑濾波41
4.3.4圖像矯正41
4.3.5完整性核查42
4.4延伸閱讀51
 
第5章基於閾值分割的車牌定位識別53
5.1案例背景53
5.2理論基礎53
5.2.1車牌圖像處理54
5.2.2車牌定位原理58
5.2.3車牌字符處理58
5.2.4車牌字符識別60
5.3程序實現62
5.4延伸閱讀69
 
第6章基於分水嶺分割進行肺癌診斷71
6.1案例背景71
6.2理論基礎71
6.2.1模擬浸水的過程72
6.2.2模擬降水的過程72
6.2.3過度分割問題72
6.2 .4標記分水嶺分割算法72
6.3程序實現73
6.4延伸閱讀77
 
第7章基於主成分分析的人臉二維碼識別79
7.1案例背景79
7.2理論基礎79
7.2.1 QR二維碼簡介80
7.2.2 QR二維碼的編碼和譯碼流程82
7.2.3主成分分析方法84
7.3程序實現85
7.3.1人臉建庫85
7.3.2人臉識別87
7.3.3人臉二維碼87
7.4延伸閱讀92
 
第8章基於知識庫的手寫體數字識別94
8.1案例背景94
8.2理論基礎94
8.2.1算法流程94
8.2.2特徵提取95
8.2.3模式識別96
8.3程序實現97
8.3.1圖像處理97
8.3.2特徵提取98
8.3.3模式識別101
8.4延伸閱讀102
8.4.1識別器選擇102
8.4.2特徵庫改善102
 
第9章基於特徵匹配的英文印刷字符識別103
9.1案例背景103
9.2理論基礎104
9.2.1圖像預處理104
9.2.2圖像識別技術105
9.3程序實現106
9.3.1界面設計106
9.3.2回調識別111
9.4延伸閱讀112
 
第10章基於不變矩的數字驗證碼識別113
10.1案例背景113
10.2理論基礎114
10.3程序實現114
10.3.1設計GUI界面114
10.3.2載入驗證碼圖像115
10.3.3驗證碼圖像去噪116
10.3.4驗證碼數字定位118
10.3.5驗證碼歸一化120
10.3.6驗證碼數字識別121
10.3.7手動確認併入庫124
10.3.8重新生成模板庫125
10.4延伸閱讀128
 
第11章基於小波技術進行圖像融合129
11.1案例背景129
11.2理論基礎130
11.3程序實現132
11.3.1設計GUI界面132
11.3.2圖像載入133
11.3. 3小波融合135
11.4延伸閱讀137
 
第12章基於塊匹配的全景圖像拼接138
12.1案例背景138
12.2理論基礎138
12.2.1圖像匹配139
12.2.2圖像融合141
12.3程序實現142
12.3.1設計GUI界面142
12.3.2載入圖片143
12.3.3圖像匹配144
12.3.4圖像拼接148
12.4延伸閱讀153
 
第13章基於霍夫曼圖像編碼的圖像壓縮和重建155
13.1案例背景155
13.2理論基礎155
13.2.1霍夫曼編碼的步驟156
13.2.2霍夫曼編碼的特點157
13.3程序實現158
13.3.1設計GUI界面158
13.3.2壓縮和重建159
13.3.3效果對比164
13.4延伸閱讀167
 
第14章基於主成分分析的圖像壓縮和重建168
14.1案例背景168
14.2理論基礎168
14.2.1主成分降維分析原理168
14.2.2由得分矩陣重建樣本169
14.2.3主成分分析數據壓縮比170
14.2.4基於主成分分析的圖像壓縮170
14.3程序實現171
14.3.1主成分分析的源代碼171
14.3 .2圖像數組和样本矩陣之間的轉換172
14.3.3基於主成分分析的圖像壓縮173
14.4延伸閱讀176
 
第15章基於小波的圖像壓縮技術177
15.1案例背景177
15.2理論基礎178
15.3程序實現180
15.4延伸閱讀188
 
第16章基於融合特徵的以圖搜圖技術189
16.1案例背景189
16.2理論基礎189
16.3程序實現191
16.3.1圖像預處理191
16.3.2計算特徵191
16.3.3圖像檢索194
16.3.4結果分析194
16.4延伸閱讀196
 
第17章基於Harris的角點特徵檢測198
17.1案例背景198
17.2理論基礎199
17.2.1 Harris的基本原理199
17.2 .2 Harris算法的流程201
17.2.3 Harris角點的性質201
17.3程序實現202
17.3.1 Harris算法的代碼202
17.3.2角點檢測實例204
17.4延伸閱讀205
 
第18章基於GUI搭建通用視頻處理工具206
18.1案例背景206
18.2理論基礎206
18.3程序實現208
18.3.1設計GUI界面208
18.3.2實現GUI界面209
18.4延伸閱讀220
 
第19章基於語音識別的信號燈圖像
模擬控制技術221
19.1案例背景221
19.2理論基礎221
19.3程序實現223
19.4延伸閱讀232
 
第20章基於幀間差法進行視頻目標檢測234
20.1案例背景234
20.2理論基礎234
20.2.1幀間差分法235
20.2.2背景差分法236
20.2.3光流法236
20.3程序實現237
20.4延伸閱讀24
 
第21章路面裂縫檢測系統設計247
21.1案例背景247
21.2理論基礎247
21.2.1圖像灰度化248
21.2.2圖像濾波250
21.2.3圖像增強252
21.2.4圖像二值化253
21.3程序實現255
21.4延伸閱讀267
 
第22章基於K-means聚類算法的圖像分割268
22.1案例背景268
22.2理論基礎268
22.2.1 K-means聚類算法的原理268
22.2.2 K-means聚類算法的要點269
22.2.3 K-means聚類算法的缺點270
22.2.4基於K-means聚類算法進行圖像分割270
22.3程序實現271
22.3.1樣本間的距離271
22.3.2提取特徵向量272
22.3.3圖像聚類分割273
22.4延伸閱讀275
 
第23章基於光流場的車流量計數應用276
23.1案例背景276
23.2理論基礎276
23.2. 1基於光流法檢測運動的原理276
23.2.2光流場的主要計算方法277
23.2.3梯度光流場約束方程278
23.2.4 Horn-Schunck光流算法280
23.3程序實現281
23.3.1計算視覺系統工具箱簡介281
23.3.2基於光流法檢測汽車運動282
23.4延伸閱讀287
 
第24章基於Simulink進行圖像和視頻處理289
24.1案例背景289
24.2模塊介紹289
24.2.1分析和增強模塊庫(Analysis和Enhancement) 290
24.2.2轉化模塊庫(Conversions) 291
24.2.3濾波模塊庫(Filtering) 292
24.2.4幾何變換模塊庫(Geometric Transformations) 292
24.2.5形態學操作模塊庫(Morphological Operations) 292
24.2.6輸入模塊庫(Sources) 293
24.2.7輸出模塊庫(Sinks) 293
24.2.8統計模塊庫(Statistics) 294
24.2.9文本和圖形模塊庫(Text和Graphic) 295
24.2.10變換模塊庫(Transforms) 295
24.2.11其他工具模塊庫(Utilities) 295
24.3仿真案例296
24.3.1搭建組織模型296
24.3.2仿真執行模型298
24.3.3自動生成報告299
24.4延伸閱讀302
 
第25章基於小波變換的數字水印技術304
25.1案例背景304
25.2理論基礎304
25.2.1數字水印技術的原理305
25.2.2典型的數字水印算法307
25.2.3數字水印攻擊和評價309
25.2.4基於小波的水印技術310
25.3程序實現312
25.3.1準備載體和水印圖像312
25.3.2小波數字水印的嵌入313
25.3.3小波數字水印的提取317
25.3.4小波水印的攻擊試驗319
25.4延伸閱讀323
 
第26章基於最小誤差法的胸片分割技術325
26.1案例背景325
26.2理論基礎325
26.2.1圖像增強326
26.2 .2區域選擇326
26.2.3形態學濾波327
26.2.4基於最小誤差法進行胸片分割328
26.3程序實現329
26.3.1設計GUI界面329
26.3.2圖像預處理330
26.3.3基於最小誤差法進行圖像分割333
26.3.4形態學後處理335
26.4延伸閱讀338
 
第27章基於區域生長的肝臟影像分割系統339
27.1案例背景339
27.2理論基礎340
27.2.1閾值分割340
27.2.2區域生長340
27.2.3基於閾值預分割的區域生長341
27.3程序實現342
27.4延伸閱讀346
 
第28章基於計算機視覺的自動駕駛應用347
28.1案例背景347
28.2理論基礎348
28.2.1環境感知348
28.2.2行為決策348
28.2.3路徑規劃349
28.2.4運動控制349
28.3程序實現349
28.3.1傳感器數據載入349
28.3.2追踪器創建351
28.3.3碰撞預警353
28.4延伸閱讀358
 
第29章基於深度學習的汽車目標檢測359
29.1案例背景359
29.2理論基礎360
29.2.1基本架構360
29.2.2卷積層360
29.2.3池化層362
29.3程序實現362
29.3.1加載數據362
29.3.2構建CNN 364
29.3.3訓練CNN 365
29.3.4評估訓練效果367
29.4延伸閱讀368
 
第30章基於深度學習的視覺場景
識別370
30.1案例背景370
30.2理論基礎371
30.3程序實現371
30.3.1環境配置372
30.3.2數據集製作373
30.3.3網絡訓練375
30.3.4網絡測試381
30.4延伸閱讀383
 
第31章深度學習綜合應用385
31.1應用背景385
31.2理論基礎387
31.2.1分類識別387
31.2.2目標檢測391
31.3案例實現1:基於CNN的數字識別395
31.3.1自定義CNN 397
31.3.2 AlexNet 399
31.3.3基於MATLAB進行實驗設計405
31.3.4基於TensorFlow進行實驗設計413
31.3.5實驗小結418
31.4案例實現2:基於CNN的物體識別418
31.4.1 CIFAR-10數據集418
31.4.2 VggNet 421
31.4.3 ResNet 422
31.4.4實驗設計424
31.4.5實驗小結432
31.5案例實現3:基於CNN的圖像矯正432
31.5.1傾斜數據集432
31.5.2自定義CNN回歸網絡434
31.5.3 AlexNet回歸網絡436
31.5.4實驗設計437
31.5.5實驗小結445
31.6案例實現4:基於LSTM的時間序列分析445
31.6.1厄爾尼諾南方濤動指數數據446
31.6.2樣條擬合分析446
31.6.3基於MATLAB進行LSTM分析448
31.6.4基於Keras進行LSTM分析451
31.6.5實驗小結455
31.7案例實現5:基於深度學習的以圖搜圖技術455
31.7.1人臉的深度特徵455
31.7.2 AlexNet的特徵460
31.7. 3 GoogleNet的特徵461
31.7.4深度特徵融合計算462
31.7.5實驗設計462
31.7.6實驗小結46731.8案例實現6:基於YOLO的交通目標檢測應用467
31.8.1車輛目標的YOLO檢測468
31.8.2交通標誌的YOLO檢測475
31.9延伸閱讀481


作者介紹


劉衍琦(ID:lyqmath)
機器學習算法專家及視覺AI課程講師,擅長視覺智能分析、多源異構數據採集和挖掘等工程應用,並長期從事視覺大數據工程相關工作,涉及互聯網海量圖像、聲紋、視頻檢索,以及OCR圖文檢索、手繪草圖智能識別、特殊通道數據分析等應用的算法架構與研發,對圖文識別、大規模以圖搜圖、數據感知和採集等進行過深入研究,並結合行業背景推動了一系列的工程化應用。
 
詹福宇(ID:dynamic)
擅長模型設計與分析,在計算機視覺處理方面積累了豐富的工程經驗
 
王德建
在檔案數字化、智能化分類、OCR圖文檢索、圖像智能識別方面積累了豐富的項目實戰經驗




相關書籍

黑帽 Python | 給駭客與滲透測試者的 Python 開發指南 (Black Hat Python: Python Programming for Hackers and Pentesters)

作者 Justin Seitz Studio Tib. 譯

2019-10-01

R Machine Learning By Example (Paperback)

作者 Raghav Bali Dipanjan Sarkar

2019-10-01

Python 深度學習實戰:75個有關神經網絡建模、強化學習與遷移學習的解決方案 (Python Deep Learning Cookbook: Over 75 practical recipes on neural network modeling, reinforcement learning, and transfer learning using Python)

作者 英德拉·丹·巴克

2019-10-01