機器學習及其應用
內容描述
本書是關於機器學習的綜合性教程,涵蓋全部基礎知識和理論,涉及不同應用領域的技術和算法。
書中提出,機器學習背後的大多數想法都是簡單且直接的。
為了鼓勵讀者在實踐中理解機器學習算法,本書提供一個配套平台,
利用自我學習的機器學習項目,再結合一些基準測試應用的數據集,
通過實驗比較書中介紹的各類算法,從而實現深入理解。
本書對於入門階段的研究生和學者非常有益,會為進一步的深入研究打好基礎。
此外,本書也適合對機器學習感興趣的工程師和其他技術人員閱讀。
目錄大綱
譯者序
前言
致謝
作者簡介
第1章引言
11走向智能機器
12良好的機器學習問題
13各種領域的應用實例
14數據表示
141時間序列預測
14 2練習數據集和現實問題數據集
15機器學習生產應用所需的領域知識
16多樣化的數據:結構的/非結構的
17學習形式
171監督/直接學習
172無監督/間接學習
173強化學習
174基於自然過程的學習:進化、群智和免疫系統
18機器學習和數據挖掘
19機器學習技術中的基本線性代數知識
110機器學習的相關資源
第2章監督學習:基本原理和基礎知識
21從觀察中學習
22偏差和方差
23為什麼學習是有效的:計算學習理論
2 4奧卡姆剃刀原理和防止過擬合
25歸納學習中的啟發式搜索
251搜索假設空間
252集成學習
253學習系統的評估
26泛化誤差估計
261留出法和隨機子採樣
262交叉驗證
263自助法
27用於評估回歸(數值預測)準確率的度量指標
271均方誤差
272平均絕對誤差
28用於評估分類(模式識別)準確率的度量指標
281誤分類的誤差
282混淆矩陣
283基於ROC曲線的分類器比較
29機器學習中的設計週期和問題概述
第3章統計學習
31機器學習和推斷統計分析
32學習技術中的描述統計學
321表示數據的不確定性:概率分佈
322概率分佈的描述性度量
323數據樣本的描述性度量
324正態分佈
325數據相似性
33貝葉斯推理:推理的一種概率方法
331貝葉斯定理
332樸素貝葉斯分類器
333貝葉斯信念網絡
34k近鄰分類器
35判別函數和回歸函數
351分類和判別函數
352數值預測和回歸函數
3 53實用假設函數
36基於最小二乘誤差準則的線性回歸
361最小化誤差平方和以及偽逆
362梯度下降優化方案
363最小均方算法
37用於分類任務的邏輯回歸
38費希爾的線性判別和分類的閾值
381費希爾的線性判別
382閾值
39最小描述長度原則
391貝葉斯視角
39 2熵和信息
第4章學習支持向量機
41引言
42二元分類的線性判別函數
43感知器算法
44用於線性可分離數據的線性邊距的分類器
45用於重疊類的線性軟邊距分類器
46核函數約簡的特徵空間
47非線性分類器
48支持向量機的回歸器
481線性回歸器
482非線性回歸器
49將多元分類問題分解為二元分類任務
491一對所有
492一對一
410基本SVM技術的變體
第5章基於神經網絡的學習
51走向認知機器
52神經元模型
521生物神經元
522人工神經元
523數學模型
53網絡架構
531前饋網絡
5 32循環網絡
54感知器
541線性分類任務中感知器算法的局限性
542使用回歸技術的線性分類器
543標準梯度下降優化方案:最速下降
55線性神經元和WidrowHoff學習規則
56誤差修正的delta規則
57多層感知器網絡和誤差反向傳播算法
57 1廣義的delta規則
572收斂和局部最小值
573為梯度下降增加動量項
574誤差反向傳播算法的啟發式方面
58MLP網絡的多元判別
5 9徑向基函數網絡
510遺傳神經系統
第6章模糊推理系統
61引言
62認知不確定性和模糊規則庫
63知識的模糊量化
631模糊邏輯
6 32模糊集
633模糊集操作
634模糊關係
64模糊規則庫和近似推理
641通過模糊關係量化規則
642輸入的模糊化
6 43推理機制
644推斷模糊集的去模糊化
65模糊推理系統的MAMDANI模型
651移動障礙物中的移動機器人導航
652抵押貸款評估
6 6TS模糊模型
67神經模糊推理系統
671ANFIS架構
672ANFIS如何學習
68遺傳模糊系統
第7章數據聚類和數據轉換
71無監督學習
72數據工程
721探索性數據分析:了解數據中的內容
722聚類分析:查找數據中的相似性
723數據轉換:增強數據的信息內容
73基本聚類方法概述
731分割聚類
732層次聚類
733譜聚類
734使用自組織映射進行聚類
74K均值聚類
75模糊K均值聚類
76期望化算法和高斯混合聚類
761EM算法
76 2高斯混合模型
77一些有用的數據轉換
771數據清洗
772衍生屬性
773離散化數值屬性
774屬性約簡技術
78基於熵的屬性離散化方法
79用於屬性約簡的主成分分析
710基於粗糙集的屬性約簡方法
7101粗糙集基礎
7102屬性相關性分析
7103屬性約簡
第8章決策樹學習
8.1引言
8.2決策樹分類的例子
8.3評估決策樹分裂的不純度度量
8.3.1信息增益/熵減少
8.3.2增益比
8.3.3基尼係數
8.4 ID3、C45以及CART決策樹
8.5樹的剪枝
8.6決策樹方法的優勢和劣勢
8.7模糊決策樹
第9章商業智能與數據挖掘:技術和應用
9.1關於分析的簡介
9.1.1機器學習、數據挖掘和預測分析
9.1.2基本分析技術
9.2CRISPDM(跨行業數據挖掘標準流程)模型
9.3數據倉庫和在線分析處理
9.3.1基本概念
9.3.2數據庫
9.3.3數據倉庫:通用架構和OLAP操作
9.3.4數據倉庫環境中的數據挖掘
9.4挖掘頻繁模式和關聯規則
9.4.1基本概念
9.4.2頻繁模式和關聯規則的強度的度量
9.4.3頻繁項集挖掘方法
9.4.4從頻繁項集生成關聯規則
9.5智能信息檢索系統
9.5.1文本檢索
9.5.2圖像檢索
9.5.3音頻檢索
9.6應用和趨勢
9.6.1數據挖掘應用程序
9.6.2數據挖掘趨勢
9.7大數據技術
9.7.1新興的分析方法
9.7.2更高級的可擴展的新興技術
附錄A用於搜索的遺傳算法
附錄B強化學習
附錄C用於機器學習實驗的真實生活應用的數據集
課後習題
參考文獻
作者介紹
M. Gopal
機器學習領域的知名學者,曾任印度理工學院教授,擁有40餘年的教學及研究經驗,
感興趣的方向為機器學習、模式識別和智能控制。
他的教材和視頻課程在全球範圍內廣為採用,
是YouTube上頗受歡迎的課程之一,學生數以百萬計。
---譯者簡介---
黃智瀕
計算機系統結構博士,北京郵電大學計算機學院講師。
長期從事機器學習、超大規模並行計算、
GPU加速計算以及三維計算機視覺和深度學習架構方面的研究。
楊武兵
博士,中國航天空氣動力技術研究院研究員,長期從事計算空氣動力學、
流動穩定性和湍流等方面的研究。
其團隊長期致力於用深度神經網絡和各類機器學習方法,
研究基於大渦模擬和直接數值模擬的流場流動結構的智能識別技術,
推進人工智能在空氣動力學領域的應用。