高效機器學習:理論、算法及實踐
內容描述
本書共11章,將高效機器學習的理論、設計原則以及實際應用有機結合,深入探討了機器學習的主要課題,包括知識發現、分類、遺傳算法、神經網絡、內核方法和生物啟發技術等。
讀者可從中瞭解機器學習技術可以解決的相關問題和相應解決方案的實現,以及新系統的設計方法。本書講解由淺入深,適合算法工程師、高校工科專業的學生、IT專業人員以及機器學習愛好者,為他們設計和創建全新有效的機器學習系統提供知識和實踐指導。
目錄大綱
譯者序
作者簡介
技術評審簡介
致謝
第1章機器學習1
1.1 關鍵術語2
1.2 機器學習的步驟4
1.3 機器學習算法6
1.4 流行的機器學習算法9
1.4.1 C4.59
1.4.2 k均值9
1.4.3 支持向量機10
1.4.4 Apriori算法10
1.4.5 估計最大化11
1.4.6 PageRank算法11
1.4.7 AdaBoost12
1.4.8 k近鄰算法13
1.4.9 樸素貝葉斯14
1.4.10 分類回歸樹14
1.5 數據挖掘研究中的挑戰性問題14
1.5.1 針對高維數據和高速數據流的擴展15
1.5.2 挖掘序列數據和時間序列數據15
1.5.3 從復雜數據中挖掘複雜知識15
1.5.4 分佈式數據挖掘與挖掘多代理數據15
1.5.5 數據挖掘過程的相關問題16
1.5.6 安全性、隱私性和數據完整性16
1.5.7 處理非靜態、不平衡和代價敏感的數據16
1.6 總結16
參考文獻16
第2章 機器學習與知識發現18
2.1 知識發現20
2.1.1 分類20
2.1.2 聚類20
2.1.3 降維21
2.1.4 協同過濾21
2.2 機器學習:分類算法21
2.2.1 邏輯回歸21
2.2.2 隨機森林22
2.2.3 隱馬爾可夫模型23
2.2.4 多層感知機24
2.3 機器學習:聚類算法26
2.3.1 k均值聚類26
2.3.2 模糊k均值(模糊c均值)26
2.3.3 流k均值算法27
2.4 機器學習:降維28
2.4.1 奇異值分解28
2.4.2 主成分分析29
2.4.3 Lanczos算法31
2.5 機器學習:協同過濾32
2.5.1 基於用戶的協同過濾32
2.5.2 基於項目的協同過濾32
2.5.3 權值-λ-正規化的交替最小二乘法33
2.6 機器學習:相似矩陣34
2.6.1 Pearson相關係數34
2.6.2 Spearman等級相關係數34
2.6.3 歐氏距離35
2.6.4 Jaccard相似係數35
2.7 總結35
參考文獻36
第3章支持向量機分類37
3.1 從幾何角度看待SVM37
3.2 SVM的主要性能38
3.3 硬間隔SVM41
3.4 軟間隔SVM43
3.5 核SVM44
3.6 多分類SVM47
3.7 SVM用於非平衡數據集49
3.8 提升SVM計算需求51
3.9 案例研究:SVM用於手寫識別53
3.9.1 預處理54
3.9.2 特徵提取54
3.9.3 分層的、三級SVM55
3.9.4 實驗結果56
3.9.5 複雜度分析57
參考文獻59
第4章支持向量回歸63
4.1 SVR概述63
4.2 SVR:概念、數學模型和圖形表示64
4.3 核SVR和不同的損失函數:數學模型和圖形表示68
4.4 貝葉斯線性回歸69
4.5 案例研究:非對稱SVR電源預測72
參考文獻75第5章隱馬爾可夫模型76
5.1 離散的馬爾可夫過程76
5.1.1 定義178
5.1.2 定義278
5.1.3 定義378
5.2 HMM簡介78
5.2.1 HMM的要點80
5.2.2 HMM的三種基本問題80
5.2. 3 HMM基本問題的解決81
5.3 連續觀測HMM86
5.3.1 多元高斯混合模型88
5.3.2 示例:工作負載相位識別88
5.3.3 監視和觀測89
5.3.4 工作負載和相位89
5.3.5 相位探測的混合模型91
參考文獻98
第6章仿生計算:群體智能100
6.1 應用101
6.1.1 演化硬件101
6.1.2 仿生網絡103
6.1.3 數據中心優化105
6.2 仿生計算算法106
6.3 群體智能106
6.3.1 蟻群優化算法107
6.3.2 粒子群優化算法109
6.3.3 人工蜂群算法111
6.4 細菌覓食優化算法113
6.5 人工免疫系統114
6.6 數據中心的分佈式管理116
6.6.1 工作負載特徵116
6.6.2熱度優化117
6.6.3 負載均衡117
6.6.4 算法模型118
參考文獻120
第7章深度神經網絡122
7.1 ANN簡介122
7.1.1 早期的ANN結構123
7.1.2 經典的ANN124
7.1.3 ANN訓練和反向傳播算法127
7.2 DBN概述128
7.3 受限玻爾茲曼機130
7.4 DNN訓練算法131
7.5 DNN相關研究133
7.5.1 DNN應用134
7.5.2 利用並行實現加快DNN訓練135
7.5.3 類似於DBN的深度網絡135
參考文獻136
第8章皮質算法141
8.1 皮質算法入門141
8.1.1 皮質算法的結構141
8.1.2 皮質算法的訓練143
8.2 權重更新145
8.3 案例研究:改進的皮質算法在阿拉伯語口語數字化中的應用149
8.3.1 基於熵的權重更新規則149
........
作者介紹
Mariette Awad
貝魯特美國大學電氣與計算機工程系副教授。她曾是麻省理工學院以及InteI移動和通信集團的客座教授,還曾在舊M公司的系統和技術團隊擔任無線產品工程師。
Rahul Khanna
Intel公司首席平台架構師,專注於節能算法的開發,因在平台技術改進領域的突出貢獻而3次獲得Intel成就獎,擁有33項發明專利。