圖解機器學習 -- 算法原理與 Python 語言實現
內容描述
《圖解機器學習——算法原理與Python語言實現》從應用場景出發,
利用大量圖解和流程圖相結合的方式講解機器學習的基本知識及其常用經典算法的應用,
全書沒有大篇幅的理論介紹和複雜的數學公式推導,也沒有生澀難懂的專業術語,
而是通過淺顯易懂的圖示、直觀的流程圖以及與生活息息相關的實例應用讓讀者輕鬆學習和掌握機器學習知識,
從而明白機器學習是如何影響和改變人類生活的。
本書共14章,覆蓋了監督學習、半監督學習、無監督學習、增強學習和機器學習新算法等內容。
具體包括最小二乘法、最近鄰算法、貝葉斯分類、支持向量機分類、增強學習AdaBoost、
決策樹算法、無監督k-Means聚類、Apriori關聯規則算法、
PageRank排序、EM參數估計、半監督學習、深度學習和遷移學習。
全書14章構成了機器學習從經典到現代的體系框架,每章也可獨立閱讀。
本書適合機器學習的入門者學習,
如果讀者已經具有Python的開發經驗,則可以更好地學習本書內容。
目錄大綱
目錄
第1章機器學習的基本概念
1.1數據挖掘和機器學習
1.1.1從AlphaGo說起
1.1.2數據挖掘和機器學習的關係
1.1.3大數據和機器學習的關係
1.1.4機器學習的思維導圖
1.1.5機器學習的一般流程
1.2數據和數據集
1.3數據預處理
1.3.1數據整理
1.3.2數據集成和融合
1.3.3數據變換
1.3.4數據規約
1.4機器學習的經典算法
1.5監督學習和無監督學習
1.6機器學習任務模仿
1.7 Python機器學習
第2章最小二乘法
2.1最小二乘法應用場景
2.2線性回歸
2.3最小二乘法的原理和算法
2.3.1變量間的關係
2.3.2數據擬合
2.3.3最小二乘法原理
2.4用最小二乘法預測學生的身高,體重
2.5邏輯回歸應用場景
2.6邏輯回歸原理
2.6.1 Sigmoid()函數
2.6.2邏輯回歸算法
2.7使用邏輯回歸對鳶尾花進行分類
第3章最近鄰算法
3.1 KNN應用場景
3.2 KNN算法概述
3.3 KNN算法流程
3.4 KNN算法核心三要素
3.4.1鄰近度指標
3.4.2如何選擇k值
3.4.3分類決策規則
3.5 KNN算法的優缺點
3.6 KNN算法的Python實現
第4章貝葉斯分類
4.1貝葉斯分類應用場景
4.2貝葉斯定理
4.3樸素貝葉斯分類原理和算法
4.4貝葉斯網絡
4.5貝葉斯估計
4.6實例:使用樸素貝葉斯對電子郵件分類
第5章支持向量機分類
5.1支持向量機分類應用場景
5.2支持向量機概念
5.3線性可分和線性不可分SVM
5.3.1線性可分SVM
5.3.2線性不可分SVM
5.3.3核函數
5.3.4分類SvM算法流程
5.4使用Sklearn的sVM支持矢量機分類器
5.4.1 Sklearn中SVM的類繼承關係
5.4.2 Sklearn線性SVM分類器
5.5實例:人臉識別分類
第6章增強學習AdaBoost
6.1增強學習AdaBoost應用場景
6.2集成方法
6.3 Boosting算法
6.4 AdaBoost算法
6.4.1單層決策樹方式的弱分類器
6.4.2 AdaBoost分類器的權重
6.4.3 AdaBoost算法流程
6.5 AdaBoost的優缺點
6.6 AdaBoost算法實現數字簡單分類
第7章決策樹算法
7.1決策樹應用場景
7.2方法樹算法概述
7.3方法樹剪枝處理
7.4 Scikit-學習決策樹算法庫
7.5 ID3算法
7.5.1 ID3算法原理
7.5.2 ID3算法的優缺點
7.5.3使用Scikit-Learn庫的ID3算法建立銷售預測決策樹
7.6 C4.5算法
7.6.1 C4.5算法原理
7.6.2 C4.5算法實例:使用Python C4.5算法建立決策樹
7.7 CART生成算法
7.7.1 CART算法原理
7.7.2 CART回歸樹的生成
7.7.3 CART分類樹的生成
7.7.4使用Scikit-學習庫的CART算法建立銷售預測決策樹
7.8實例:決策樹預測隱形眼鏡類型
第8章無監督k-Means聚類
8.1無監督k-Means聚類應用場景
8.2無監督學習算法
8.3 k-Means算法介紹
8.3.1 k-Means算法概述
8.3.2 k-Means和KNN算法
8.4 k-Means算法原理和流程
8.4.1歐氏距離
8.4.2平均誤差規範函數
8.4.3 k-Means聚類算法流程
8.5 Sklearn庫的k-Means算法支持
8.6使用Sklearn的k-Means實現鳶尾花聚類
8.7飛行使用k-Means算法實現客戶分類
第9章Apriori關聯規則算法
9.1關聯規則算法應用場景
9.2關聯規則概述-有趣的啤酒和尿布
9.3關聯規則挖掘算法
9.4 Apriori關聯規則算法原理
9.4.1基本概念
9.4.2關聯規則的分類
9.4.3 Apriori算法原理
9.4.4發現過多項集過程
9.4.5 Apriori算法示例
9.5使用Apriori算法發現酒店替代間關聯規則
第10章PageRank排序
10.1 PageRank排序應用場景
10.2 PageRank分類概述
10.3 PageRank模型和算法
10.3.1如何定義網頁本身的本質
10.3.2 Pa〜eRank的核心思路
10.3.3 PageRank模型
10.4 PageRank排序算法的優缺點
10.5 PageRank排序實例:發現網頁之間的鏈接關係
第11章EM參數估計
11.1參數估計應用場景
11.2極大似然估計
11.3 EM算法原理
11.3.1 EM算法和極大似然法對比
11.3.2最大似然法和EM算法解決硬幣概率問題
11.3.3 EM算法繼承過程
11.3.4 EM。算法的坐標上升法
11.4使用EM算法實現參數估計實例
11.4.1實例1:質量分佈數據參數估計
11.4.2實例2:在高斯混合模型中的應用
第12章半監督學習
12.1半監督學習應用場景
12.2半監督學習概述
12.3半監督學習方法
12.4基於圖的半監督學習
12.4.1建立相似矩陣
12.4.2 LP算法
12.5 Python實現標籤傳播算法
第13章深度學習
13.1深度學習應用場景
13.2淺層學習
作者介紹
丁毓峰
博士,武漢理工大學副教授,IEEE學會會員,中國計算機學會會員。
加拿大多倫多大學CIMS實驗室訪問學者,美國紐黑文大學和耶魯大學訪問學者。
主要研究方向為數字製造,嵌入式系統開發和機器學習等。
主持了多個科研項目,獲得發明專利1項,計算機軟件著作權8項。