
機器學習應用實戰
內容描述
本書將基礎理論和案例實戰相結合,循序漸進地介紹了關於機器學習領域中的經典和流行算法,全面、系統地介紹了使用Python實現機器學習算法,並通過PyTorch框架實現機器學習算法中的深度學習內容。第一部分為基礎篇,包括第1~8章,系統地介紹了機器學習基礎、數據預處理、簡單分類算法、決策樹、支持向量機、回歸分析、聚類分析、神經網絡與多層感知機; 第二部分為綜合篇,包括第9~12章,介紹了CNN、RNN、GNN及GAN等經典深度學習方法及其在電腦視覺與自然語言處理領域中的應用實踐; 第三部分為拓展篇,包括第13~15章,以百度飛槳和曠視天元為例介紹了具有代表性的國產開源框架及其應用案例,最後簡要介紹了國內外兩個主流機器學習競賽平臺。
本書主要面向廣大從事數據分析、機器學習、數據挖掘或深度學習的專業人員,從事高等教育的專任教師,高等學校的在讀學生及相關領域的科研人員。
目錄大綱
目錄
第一部分基礎篇
第1章機器學習基礎
1.1機器學習概述
1.1.1機器學習任務
1.1.2重要概念
1.1.3性能評估
1.2編程語言與環境
1.2.1Python簡介
1.2.2Python環境配置與安裝
1.2.3Python機器學習編程庫
1.2.4PyTorch框架
第2章數據預處理
2.1數據清洗
2.1.1缺失值處理
2.1.2離群值檢測
2.2數據轉換
2.2.1數字化
2.2.2離散化
2.2.3正規化
2.2.4數值轉換
2.3數據壓縮
2.3.1降維
2.3.2實例選擇和採樣
2.4應用案例: 基於PCA的數據降維
2.4.1數據集
2.4.2PCA降維
2.4.3案例結果及分析
第3章簡單分類算法
3.1樸素貝葉斯分類算法
3.2KNN分類算法
3.2.1KNN算法實現原理
3.2.2KNN算法實現步驟
3.2.3KNN算法優缺點
3.3應用案例: KNN分類
3.3.1數據集
3.3.2構建KNN分類器
3.3.3案例結果及分析
第4章決策樹
4.1決策樹模型
4.2特徵選擇
4.2.1特徵和數據劃分
4.2.2劃分標準
4.3決策樹生成算法
4.3.1ID3決策樹生成算法
4.3.2C4.5決策樹生成算法
4.4CART算法
4.4.1決策樹的剪枝
4.4.2CART生成算法
4.4.3CART剪枝算法
4.5應用案例: 基於決策樹的鳶尾花圖像分類
4.5.1數據集
4.5.2構建決策樹
4.5.3案例結果及分析
第5章支持向量機
5.1支持向量機的基本原理
5.1.1線性可分
5.1.2最大間隔問題
5.1.3支持向量
5.2常用核函數
5.2.1線性核函數
5.2.2高斯核函數
5.2.3多項式核函數
5.3應用案例: 基於SVM的異或數據集劃分
5.3.1數據集及數據預處理
5.3.2構建SVM分類器
5.3.3案例結果及分析
第6章回歸分析
6.1線性回歸
6.1.1簡單線性回歸
6.1.2多元線性回歸
6.2多項式回歸
6.3正則化回歸
6.3.1嶺回歸
6.3.2最小絕對收縮與選擇算子
6.3.3彈性網絡
6.4隨機森林回歸
6.5回歸模型的性能評估
6.6回歸模型的實現
6.6.1線性回歸實現
6.6.2多項式回歸實現
6.6.3正則化回歸實現
6.6.4隨機森林回歸實現
6.7應用案例: 基於隨機森林的房價預測
6.7.1數據集
6.7.2數據預處理
6.7.3隨機森林回歸模型建立
6.7.4案例結果及分析
第7章聚類分析
7.1聚類概述
7.1.1性能度量
7.1.2距離計算
7.2Kmeans算法
7.3層次聚類
7.4密度聚類
7.4.1DBSCAN相關概念
7.4.2DBSCAN算法流程
7.5應用案例
7.5.1Kmeans應用案例
7.5.2層次聚類應用案例
7.5.3DBSCAN應用案例
第8章神經網絡與多層感知機
8.1神經元模型
8.2感知機原理及結構
8.2.1單層感知機
8.2.2多層感知機
8.2.3反向傳播算法
8.3應用案例: 基於多層感知機的手寫數字識別
8.3.1數據集及數據預處理
8.3.2三層感知機構建
8.3.3案例結果及分析
第二部分綜合篇
第9章基於CNN的圖像識別
9.1CNN的基本組成
9.1.1捲積運算基本過程
9.1.2多通道捲積
9.1.3池化
9.2CNN模型簡介
9.3基於PyTorch構建CNN
9.4應用案例: 基於CNN的人臉性別識別
9.4.1數據集
9.4.2數據預處理
9.4.3搭建捲積神經網絡
9.4.4案例結果及分析
第10章基於RNN的序列數據分類
10.1面向序列數據的機器學習
10.1.1RNN相關背景知識
10.1.2序列數據
10.1.3序列數據與建模
10.2RNN的常用網絡結構
10.2.1基本結構
10.2.2簡單循環網絡模型
10.2.3門控算法模型
10.3基於PyTorch構建LSTM
10.4應用案例: 基於LSTM的文本分類
10.4.1數據準備
10.4.2模型構建和實現
10.4.3訓練模型
10.4.4測試模型
第11章基於GNN的文本分類
11.1GNN基礎
11.1.1GNN模型簡介
11.1.2GCN模型簡介
11.2GCN構建
11.2.1代碼層次結構
11.2.2代碼實現
11.3應用案例: 基於GCN的文本分類
11.3.1TextGCN介紹
11.3.2基於TextGCN的文本分類
11.3.3案例結果及分析
第12章基於GAN的圖像生成
12.1GAN概述
12.1.1自編碼器
12.1.2生成模型
12.1.3GAN基本原理
12.1.4GAN模型結構
12.1.5GAN的兩種目標函數
12.1.6GAN的訓練
12.2基於PyTorch構建GAN
12.2.1網絡結構
12.2.2基於PyTorch建立GAN模型
12.3應用案例: 基於GAN的圖像生成
12.3.1FashionMNIST數據集
12.3.2數據預處理
12.3.3搭建GAN模型
12.3.4案例結果及分析
第三部分拓展篇
第13章基於百度飛槳的車道線檢測
13.1百度飛槳平臺簡介
13.2百度AI Studio平臺簡介
13.3使用AI Studio平臺創建第一個項目
13.4應用案例: 車道線檢測
13.4.1車道線檢測數據集
13.4.2評價指標
13.4.3數據預處理
13.4.4模型構建
13.4.5訓練和預測
第14章基於曠視天元MegEngine的目標檢測
14.1曠視天元MegEngine平臺簡介
14.1.1MegEngine整體架構
14.1.2曠視天元平臺特點
14.2MegEngine平臺使用方法
14.2.1註冊
14.2.2創建項目
14.3應用案例: 基於MegEngine的目標檢測
14.3.1MSCOCO數據集
14.3.2目標檢測評估指標
14.3.3模型訓練與測試
第15章機器學習競賽平臺實踐
15.1主流競賽平臺
15.1.1Kaggle競賽
15.1.2天池大數據競賽
15.2Kaggle競賽實踐
15.2.1應用案例1: 泰坦尼克之災
15.2.2應用案例2: 細粒度犬種識別
15.2.3應用案例3: Home Depot產品相關性預測
15.3天池大數據競賽實踐
15.3.1應用案例1: 街景字符編碼識別
15.3.2應用案例2: NLP新聞文本分類
15.3.3應用案例3: 貸款違約預測
參考文獻