機器學習 : 從公理到算法 (Machine learning: from axioms to algorithms)
內容描述
這是一本基於公理研究學習算法的書。共 17章,由兩部分組成。第一部分是機器學習公理以及部分理論演繹,包括第 1、2、6、8 章,論述學習公理以及相應的聚類、分類理論。第二部分關註如何從公理推出經典學習算法,包括單類、多類和多源問題。第 3~5 章為單類問題,分別論述密度估計、回歸和單類數據降維。第 7、9~16 章為多類問題,包括聚類、神經網絡、 K近鄰、支持向量機、Logistic回歸、貝葉斯分類、決策樹、多類降維與升維等經典算法。最後第 17章研究了多源數據學習問題。
本書可以作為高等院校電腦、自動化、數學、統計學、人工智能及相關專業的研究生教材,也可以供機器學習的愛好者參考。
編輯推薦
機器學習是本次人工智能熱潮的核心技術。引起轟動的應用如AlphaGo等,都可以看到機器學習的身影。目前,機器學習理論紛繁複雜,算法形式花樣百出。人們一直在疑惑,機器學習,特別是其中的深度學習的本質到底是什麼?
作者積二十年研究之力,將各種學習理論融於一體,提出了五條學習公理,據此推導出了常見的學習算法,包括深度學習。如果想要知道機器學習的本質,快速理清各種學習算法之間的關係,本書是一條不容錯過的終南捷徑。
目錄大綱
第1章引言
1.1機器學習的目的:從數據到知識
1.2機器學習的基本框架
1.2.1數據集合與對象特性表示
1.2.2學習判據
1.2.3學習算泫
1.3機器學習思想簡論
延伸閱讀
習題
參考文獻
第2章歸類理論
2.1類表示公理
2.2歸類公理
2.3歸類結果分類
2.4歸類方法設計準則
2.4.1類一致性準則
2.4.2類緊緻性準則
2.4.3類分離性準則
2.4 .4奧卡姆剃刀準則
討論
延伸閱讀
習題
參考文獻
第3章密度估計
3.1密度估計的參數方法
3.1.1最大似然估計
3.1.2貝葉斯估計
3.2密度估計的非參數方法
3.2.1直方圖
3.2.2核密度估計
3.2.3K近鄰密度估計法
延伸閱讀
習題
參考文獻
第4章回歸
4.1線性回歸
4.2嶺回歸
4.3Lasso回歸
討論
習題
參考文獻
第5章單類數據降維
5.1主成分分析
5.2非負矩陣分解
5.3字典學習與稀疏表示
5.4局部線性嵌入
5.5典型關聯分析
5.6多維度尺度分析與等距映射
討論
習題
參考文獻
第6章聚類理論
6.1聚類問題表示及相關定義
6.2 類算法設計準則
6.2.1類緊緻性準則和聚類不等式
6.2.2類分離性準則和重合類非穩定假設
6.2.3類一致性準則和迭代型聚類算法
6.3聚類有效性
6.3.1外部方法
6.3.2內蘊方法
延伸閱讀
習題
參考文獻
第7章聚類算法
7.1樣例理論:層次聚類算法
7.2原型理論:點原型聚類算法
7.2.1C均值算法
7.2.2模糊C均值
7.3基於密度估計的聚類算法
7.3.1基於參數密度估計的聚類算法
7.3.2基於無參數密度估計的聚類算法
延伸閱讀
習題
參考文獻
第8章分類理論
8.1分類及相關定義
8.2從歸類理論到經典分類理論
8.2.1PAC理論
8.2.2統計機器學習理論
8.3分類測試公理
討論
習題
參考文獻
第9章基於單類的分類算法:神經網絡
9.1分類問題的回歸表示
9.2人工神經網絡
9.2.1人工神經網絡相關介紹
9.2.2前饋神經網絡
9.3從參數密度估計到受限玻耳茲曼機
9.4深度學習
9.4.1自編碼器
9.4.2卷積神經網絡
討論
習題
參考文獻
第10章K近鄰 分類模型
10.1K近鄰算法
10.1.1K近鄰算法問題表示
10.1.2K近鄰分類算法
10.1.3K近鄰分類算法的理論錯誤率
10.2距離加權最近鄰算法
10.3K近鄰算法加速策略
10.4kd樹
10.5K近鄰算法中的參數問題
延伸閱讀
習題
參考文獻
第11章線性分類模型
11.1判別函數和判別模型
11.2線性判別函數
11.3線性感知機算法
11.3.1感知機數據表示
11.3.2感知機算法的歸類判據
11.3.3感知機分類算法
11.4支持向量機
11.4.1線性可分支持向量機
11.4.2近似線性可分支持向量機
11.4.3多類分類問題
討論
習題
參考文獻
第12章對數線性分類模型
第13章貝葉斯決策
第14章決策樹
第15章多類數據降維
第16章多類數據升維:核方法
作者介紹
於劍,北京交通大學計算機學院教授,博士生導師,交通數據分析與挖掘北京市重點實驗室主任,先後獲得北京大學數學專業本科、碩士、博士,中國人工智能學會機器學習專委會副主任,中國計算機學會人工智能與模式識別專委會秘書長,承擔多項國家自然科學基金項目,發表多篇學術論文,包括TPAMI、CVPR等。