機器學習實踐指南
內容描述
機器學習應用遍及人工智能的各個領域,是眾多數學科學家需要學習的內容。本書第壹部分提供了一個相當復雜的機器學習系統,以幫助讀者提高其效率。第二部分重點介紹了三個不同的基於現實世界的數據的案例研究,並提供相應解決方案。全書通過知識介紹,使讀者瞭解收集數據、準備使用數據、訓練模型、評估模型的性能,以及改進模型的性能的方法;通過對實際問題解決的講解,幫助讀者獲得處理機器學習問題的經驗。
目錄大綱
前言
第1章機器學習引言1
1.1什麼是機器學習1
1.2分類方法概述2
1.3聚類方法概述2
1.4監督學習概述3
1.5無監督學習概述4
1.6增強學習概述4
1.7結構化預測概述5
1.8神經網絡概述5
1.9深度學習概述6
第2章分類7
2.1引言7
2.2判別函數分析:地下鹵水地質化學測量8
2.3多元邏輯回歸:理解學生的課程計劃選擇15
2.4 Tobit回歸:評估學生的學術能力20
2.5泊松回歸:理解加拉帕戈斯群島現存物種27
第3章聚類38
3.1引言38
3.2層次聚類:世界銀行樣本數據集39
3.3層次聚類:1999~2010年
亞馬遜雨林的燒毀情況44
3.4層次聚類:基因聚類55
3.5二進制聚類:數學測驗68
3.6 k均值聚類:歐洲各國蛋白質消耗量75
3.7 k均值聚類:食品80
第4章模型選擇和正則化86
4.1引言86
4.2壓縮方法:每天消耗的卡路里87
4.3降維方法:Delta航空公司航空隊100
4.4主成分分析:理解世界菜餚109
第5章非線性114
5.1廣義加性模型:衡量新西蘭的家庭收入114
5.2平滑樣條:理解汽車和速度119
5.3局部回歸:理解乾旱警告和影響129
第6章監督學習136
6.1引言136
6.2決策樹學習:對胸痛患者的預先醫療護理指示137
6.3決策樹學習:基於收入的房地產價值分佈145
6.4決策樹學習:預測股票走勢方向154
6.5樸素貝葉斯:預測股票走勢方向170
6.6隨機森林:貨幣交易策略184
6.7支持向量機:貨幣交易策略193
6.8隨機梯度下降:成人收入201
第7章無監督學習208
7.1引言208
7.2自組織映射:可視化熱圖209
7.3矢量量化:圖像聚類212
第8章增強學習217
8.1引言217
8.2馬爾可夫鏈:股票區製轉移模型218
8.3馬爾可夫鏈:多渠道歸因模型229
8.4馬爾可夫鏈:汽車租賃 理服務239
8.5連續馬爾可夫鏈:加油站的車輛服務243
8.6蒙特卡羅模擬:校準Hull-White短期利率247
第9章結構化預測257
9.1引言257
9.2隱馬爾可夫模型:歐元和美元257
9.3隱馬爾可夫模型:區製檢測263
第10章神經網絡270
10.1引言270
10.2為S&P 500建模270
10.3衡量失業率278
第11章深度學習292
11.1引言292
11.2循環神經網絡:預測週期信號292
第12章案例研究:探索世界銀行數據299
12.1引言299
12.2探索世界銀行數據299
第13章案例研究:再保險合同定價316
13.1引言316
13.2再保險合同定價316
第14章案例研究:用電量預測329
14.1引言329
14.2用電量測量329
作者介紹
作者:(英)阿圖爾·特里帕蒂 譯者:王喆、曹建勳
阿圖爾·特里帕蒂(Atul Tripathi),在機器學習和量化投資領域有超過11年的從業經歷,並擁有14年的軟件開發和研究經驗。他一直致力於先進的機器學習技術,如神經網絡和馬爾可夫模型的研究。在研究機器學習技術的同時,他利用其解決了圖像處理、電信、語音識別和自然語言處理等領域相關的諸多問題。他還利用神經網絡模型開發了文本挖掘工具。在量化投資領域,他利用蒙特卡羅仿真開發了價值風險、極值定理、期權定價和能源衍生品等模型。