深度學習在數字圖像處理中的應用

深度學習在數字圖像處理中的應用

作者: 馬龍華 陸哲明 崔家林 等
出版社: 電子工業
出版在: 2022-06-01
ISBN-13: 9787121437083
ISBN-10: 7121437082
總頁數: 304 頁





內容描述


深度學習憑借其在識別應用領域中超高的預測準確率,在圖像處理領域獲得了極大關註,這勢必將提升現有圖像處理系統的性能並開創新的應用領域。利用捲積神經網絡等深層神經網絡的解決方案,可以逐漸取代基於算法可解釋的傳統圖像處理工作。盡管圖像預處理、後期處理和信號處理仍在大量採用現有方法,但在圖像分類應用中,深度學習變得愈加重要。在該背景下,本書系統介紹了深度學習在數字圖像處理各個研究分支的應用,包括圖像增強、圖像復原、圖像檢索、圖像壓縮、圖像分割、目標檢測、動作識別和圖像配準等。每一部分都對傳統方法做了概述,並穿插介紹本書作者的研究成果,反映了深度學習在數字圖像處理各個研究分支的發展現狀。本書可作為高等院校具有一定電腦基礎的人工智能、自動化、信號與信息處理、電子信息工程、電腦科學與技術、通信工程等專業的研究生或高年級本科生的教材或參考書,也可作為科研院所相關專業的科技工作者的參考書。


目錄大綱


第1章 數字圖像處理概述 1
1.1 數字圖像的基本概念 1
1.1.1 數字圖像 1
1.1.2 獲取靜態數字圖像的方式 7
1.1.3 色彩及色彩模型 10
1.2 數字圖像的獲取與描述 15
1.2.1 圖像數字化 15
1.2.2 圖像灰度直方圖 17
1.2.3 圖像處理算法的形式 20
1.2.4 圖像的數據結構與特徵 21
1.3 數字圖像處理的研究內容和應用領域 25
1.3.1 數字圖像處理的基本流程 25
1.3.2 數字圖像處理的研究分支 26
1.3.3 傳統數字圖像處理常用的理論工具 30
1.3.4 數字圖像處理的應用領域 30
參考文獻 32
第2章 深度學習概述 33
2.1 深度學習的概念 33
2.1.1 深度學習的歷史背景 33
2.1.2 深度學習的基本思想 33
2.1.3 深度學習的本質和優勢 34
2.2 國內外研究現狀 35
2.2.1 深度學習在語音識別領域的研究現狀 35
2.2.2 深度學習在圖像識別領域的研究現狀 37
2.2.3 深度學習在自然語言處理領域的研究現狀 40
2.3 深度學習典型模型結構和訓練算法 41
2.3.1 感知機 42
2.3.2 前饋神經網絡之多層感知機 43
2.3.3 前饋神經網絡之捲積神經網絡 45
2.3.4 反饋深度網絡 48
2.3.5 雙向深度網絡 50
2.3.6 深度學習訓練算法 55
2.4 深度學習的優點和已有的應用 57
2.4.1 深度學習的優點 57
2.4.2 深度學習已有的典型應用 57
2.5 深度學習存在的問題及未來研究方向 60
2.5.1 深度學習目前存在的問題 60
2.5.2 深度學習未來研究方向 61
參考文獻 62
第3章 基於深度學習的圖像增強與圖像恢復 66
3.1 圖像去噪 66
3.1.1 傳統圖像去噪方法概述 66
3.1.2 基於DnCNN的圖像去噪 69
3.1.3 基於CBDNet的圖像去噪 72
3.2 圖像去霧 74
3.2.1 傳統圖像去霧方法概述 74
3.2.2 基於DehazeNet的圖像去霧 77
3.2.3 基於EPDN的圖像去霧 79
3.2.4 基於PMS-Net的圖像去霧 80
3.3 圖像去模糊 82
3.3.1 傳統圖像去模糊方法概述 82
3.3.2 基於ResBlock的圖像去模糊 85
3.3.3 基於DAVANet的圖像去模糊 86
3.4 圖像增強 91
3.4.1 傳統圖像增強方法概述 91
3.4.2 基於Deep Bilateral Learning的圖像增強 94
3.4.3 基於Deep Photo Enhancer的圖像增強 96
3.4.4 基於Deep Illumination Estimation的圖像增強 97
參考文獻 99
第4章 基於深度學習的圖像檢索 105
4.1 圖像檢索的研究背景和研究現狀 105
4.1.1 圖像檢索的研究背景 105
4.1.2 為什麽要引入深度學習 106
4.1.3 圖像檢索的研究現狀 106
4.2 圖像特徵和相似性度量 108
4.2.1 原始數據層特徵 108
4.2.2 物理層特徵 109
4.2.3 語義層特徵 110
4.2.4 圖像相似性度量 110
4.3 基於內容的圖像檢索 111
4.3.1 基於顏色特徵的圖像檢索 111
4.3.2 基於紋理特徵的圖像檢索 113
4.3.3 基於形狀特徵的圖像檢索 114
4.3.4 基於多特徵的圖像檢索 115
4.3.5 基於視覺詞袋的圖像檢索 119
4.4 基於註意力機制和捲積神經網絡的圖像檢索 122
4.4.1 註意力機制簡介 122
4.4.2 圖像檢索中的註意力機制 123
4.4.3 基於註意力機制和捲積神經網絡模型的圖像檢索 124
4.4.4 實驗結果 127
4.5 基於深度信念網絡的人臉圖像檢索 130
4.5.1 局部二值模式 130
4.5.2 DBN訓練模型 130
4.5.3 融合LBP算子與DBN網絡模型的圖像檢索 131
4.5.4 實驗結果 131
參考文獻 132
第5章 基於深度學習的圖像壓縮 136
5.1 圖像壓縮概述 136
5.1.1 圖像壓縮的目的和意義 136
5.1.2 傳統圖像壓縮的方法分類和簡介 137
5.1.3 為什麽要引入深度學習 139
5.1.4 基於深度學習的圖像壓縮技術現狀 139
5.2 基於矢量量化的圖像壓縮方法 140
5.2.1 基於矢量量化的圖像壓縮概述 140
5.2.2 基於邊緣分類和範數排序的K-means算法的碼書設計 142
5.2.3 基於特徵分類和分組初始化的改進K-means算法的碼書設計 146
5.3 基於深度學習的圖像壓縮方法 151
5.3.1 基於捲積神經網絡的圖像壓縮方法概述 151
5.3.2 基於循環神經網絡的圖像壓縮方法概述 153
5.3.3 基於生成對抗網絡的圖像壓縮方法概述 154
5.3.4 結合捲積神經網絡和傳統方法的圖像壓縮 155
5.3.5 實驗結果與分析 159
參考文獻 161
第6章 基於深度學習的圖像分割 167
6.1 圖像分割概述 167
6.1.1 圖像分割的目的和意義 167
6.1.2 傳統圖像分割方法分類 168
6.1.3 典型傳統圖像分割方法簡介 170
6.1.4 為什麽引入深度學習 175
6.2 復雜背景下毛坯輪轂圖像分割及圓心精確定位 176
6.2.1 引言 176
6.2.2 基於超像素能量譜的輪轂分割 177
6.2.3 精確圓擬合算法 178
6.2.4 圓擬合結果分析 179
6.3 基於深度學習的圖像分割概述 181
6.3.1 研究現狀 181
6.3.2 幾種典型實現方案 182
6.3.3 基於全捲積神經網絡的圖像分割實驗結果 185
6.4 基於深度生成對抗網絡的超聲圖像分割 186
6.4.1 引言 186
6.4.2 相關工作 187
6.4.3 基於深度生成對抗網絡的臂叢分割 188
6.4.4 實驗 190
參考文獻 193
第7章 基於深度學習的人臉檢測與行人檢測 198
7.1 基於深度學習的人臉檢測 198
7.1.1 人臉檢測概述 198
7.1.2 基於深度學習的人臉檢測算法分類和數據集 200
7.1.3 多任務級聯捲積網絡的加速 203
7.1.4 實驗結果 209
7.2 行人檢測概述 212
7.2.1 行人檢測基本框架 212
7.2.2 基於傳統機器學習的方法 212
7.2.3 基於深度學習的方法 213
7.2.4 行人檢測評判標準 216
7.3 基於ViBe結合HOG+SVM的快速行人檢測與跟蹤 216
7.3.1 引言 216
7.3.2 ViBe算法 217
7.3.3 基於HOG+SVM的行人檢測 218
7.3.4 基於ViBe結合HOG+SVM方案 220
7.3.5 實驗結果與分析 222
參考文獻 227
第8章 基於深度學習的動作識別 232
8.1 人體動作識別技術概述 232
8.1.1 引言 232
8.1.2 國內外研究現狀 233
8.1.3 研究難點 236
8.2 動作識別相關技術 237
8.2.1 圖捲積網絡 237
8.2.2 用於骨骼動作識別的空時圖捲積網絡 239
8.2.3 用於視頻動作識別的雙流捲積網絡 240
8.2.4 動作識別相關數據集 241
8.3 人體姿態估計 244
8.3.1 人體姿態估計的分類 244
8.3.2 OpenPose算法 245
8.3.3 AlphaPose算法 248
8.3.4 實驗結果比較分析 251
8.4 基於圖捲積網絡的骨骼序列動作識別算法 253
8.4.1 引言 253
8.4.2 註意力機制和共現特徵學習 253
8.4.3 基於圖捲積網絡的多任務框架 254
8.4.4 實驗結果及分析 257
8.5 一種替代光流的視頻動作識別算法 261
8.5.1 基於光流估計的雙流捲積網絡 261
8.5.2 時間軌跡濾波器 262
8.5.3 隨機跨幀融合 264
8.5.4 實驗結果及分析 265
參考文獻 266
第9章 基於深度學習的醫學圖像配準 270
9.1 醫學圖像配準概述 270
9.1.1 基本概念 270
9.1.2 基本變換 270
9.1.3 方法分類 272
9.1.4 典型配準方法 272
9.1.5 評估方法 273
9.2 基於分形沙漏網絡由MV-DR合成kV-DRR 274
9.2.1 引言 274
9.2.2 分形沙漏網絡 274
9.2.3 實驗 276
9.3 基於公共表徵學習和幾何約束的多模態醫學圖像配準 278
9.3.1 引言 278
9.3.2 方法 279
9.3.3 實驗及算法比較 280
9.4 基於信息瓶頸條件生成對抗網絡的MV-DR和kV-DRR配準 281
9.4.1 引言 281
9.4.2 材料和方法 282
9.4.3 結果 287
參考文獻 290




相關書籍

誰說菜鳥不會電商數據分析

作者 小2哥

2022-06-01

Beginning Data Science in R 4: Data Analysis, Visualization, and Modelling for the Data Scientist

作者 Mailund Thomas

2022-06-01

基於函數逼近的強化學習與動態規劃

作者 [羅]盧西恩·布索尼 [荷]羅伯特·巴布斯卡 [荷]巴特·德·舒特 [比]達米安·厄恩斯特

2022-06-01