機器學習算法評估實戰 (全彩印刷)
內容描述
機器學習算法評估力求用科學的指標,對機器學習算法進行完整、可靠的評價。
本書詳細介紹機器學習算法評估的理論、方法和實踐。全書分為3個部分。第1部分包含第1章~第3章,針對分類算法、回歸算法和聚類算法分別介紹對應的基礎理論和評估方法;第2部分包含第4章~第8章,介紹更復雜的模型(如深度學習模型和集成樹模型)的對比與評估,並且針對它們實際應用的業務場景介紹一些特有的評估指標和評估體系;第3部分包含第9章~第11章,總結算法評估的常用工具、技術及方法論,包括實用的可視化工具介紹,並討論機器學習算法的本質。
本書適合機器學習專業相關從業者和算法工程師閱讀,也適合想要從事人工智能和機器學習工作的人士學習和參考。
目錄大綱
第1章分類的藝術1
1.1訓練集和測試集的選擇1
1.2準召率和PR曲線6
1.3 ROC和AUC 8
1.5異常檢測12
1.5小結14
第2章一個好的回歸算法15
2.1 ME那些事15
2.2方差和偏差17
2.3欠擬合和過擬合18
2.4正則化方法20
2.5回歸算法的對比24
2.5.1線性回歸24
2.5.2局部加權線性回歸25
2.5.3嶺回歸26
2.6梯度下降的對比26
2.6.1一般的梯度下降26
2.6.2隨機梯度下降和批量梯度下降28
2.6.3動量梯度下降29
2.6.4 AdaGrad、RMSProp和Adam 29
2.7小結31
第3章“硬核”聚類33
3.1無監督學習33
3.2聚類算法的評估指標34
3.2.1霍普金斯統計量34
3.2.2類簇的數量35
3.2.3聚類效果39
3.3聚類算法的對比44
3.3.1基於密度的聚類44
3.3.2 K-means 45
3.3.3基於層次的聚類46
3.3.4基於概率的聚類47
3.4小結48
第4章慧眼識天下——深度學習算法原理對比49
4.1卷積神經網絡49
4 .1.1簡單的捲積神經網絡49
4.1.2詳解卷積神經網絡53
4.2循環神經網絡60
4.2.1圖解RNN 60
4.2.2 RNN的訓練65
4.2. 3 RNN的變化形式67
4.3更實用的模型68
4.3.1 LSTM 69
4.3.2 Seq2Seq 71
4.3.3注意力機制73
4.4小結74
第5章智慧的語言—— NLP算法實戰與評估76
5.1文字的預處理76
5.1.1嵌入76
5.1.2 word2vec 77
5.1.3詞袋模型與TF-IDF 82
5.2 RNN文本分類84
5. 2.1 RNN文本分類的模塊84
5.2.2參數定義84
5.2.3預處理85
5.2.4模型定義86
5.2.5模型訓練和評估87
5.3 HAN文本分類88
5.3.1 HAN和GRU的基本原理88
5.3.2 HAN的注意力層90
5.4 NLP評估92
5.4.1 N-gram 92
5.4.2 BLEU 93
5.4.3 ROUGE 96
5.4.4 Pointwise、Pairwise和Listwise排序算法98
5.5小結100
第6章預言家的思考——樹模型的對比與評估101
6.1基礎樹模型的對比101
6.1.1 ID3 101
6.1.2 C4.5 103
6 .1.3 CART 104
6.2隨機森林和AdaBoost 106
6.2.1隨機森林106
6.2.2 AdaBoost 108
6.3 GBDT 110
6.3.1 GBDT簡介110
6.3.2 GBDT和回歸問題111
6.3.3 GBDT和分類問題117
6.4 XGBoost 124
6.4.1 XGBoost簡介124
6.4.2 XGBoost回歸算法127
6.4.3 XGBoost分類算法132
6.4.4 XGBoost的優化方法和特徵評估136
6.4.5 GBDT和XGBoost的對比評估139
6.5小結140
第7章愛我所愛——推薦算法對比與評估141
7.1多路召回141
7.1.1基於用戶的協同過濾141
7.1.2基於物品的協同過濾144
7.2邏輯斯諦回歸145
7.2.1邏輯斯諦回歸的基本原理145
7.2.2邏輯斯諦回歸和推薦排序148
7.3 FM、FFM和特徵組合150
7.3.1 FM基本原理151
7.3 .2用FFM和GBDT進行高階特徵組合153
7.4 Wide&Deep 155
7.5更有趣的模型——Transformer 157
7.5.1模型整體架構158
7.5.2注意力機制159
7.5. 3編碼器163
7.5.4解碼器163
7.5.5基於位置的前饋神經網絡164
7.5.6嵌入層165
7.5.7線性層和softmax層166
7.5.8 Transformer在推薦系統的應用167
7.6推薦算法的評估170
7.6.1準確度指標171
7.6.2排序指標172
7.6.3覆蓋率175
7.6.4多樣性和新穎性175
7.7小結176
第8章奇門遁甲—LBS算法與評估177
8.1坐標177
8.1.1坐標生成177
8.1.2基於密度的坐標生成179
8.1.3基於GeoHash塊熱度的坐標生成180
8.1.4坐標質量評估181
8.2路線183
8.2.1路線相似度評估183
8.2.2路線規劃——Dijkstra算法185
8.2.3路線排序188
8.2.4路線質量評估194
8.3小結196
第9章評估利器——交互式可視化198
9.1 R語言簡介198
9.1.1為什麼要可視化198
9.1.2 R語言介紹199
9.1.3數據生態202
9.2 Shiny可視化204
9.2.1 UI佈局204
9.2.2服務器209
9.2.3可視化評估示例212
9.3小結215
第10章像哲學家一樣思考——因果推斷216
10.1機器學習之殤216
鸚鵡學舌vs.烏鴉喝水216
10.2辛普森悖論218
10.3伯克森悖論223
10.4智能之梯224
10.4.1因果推斷的起源224
10.4.2智能之梯225
10.5因果推斷的方法228
10.5.1雙重差分模型228
10.5.2工具變量229
10.5.3中介模型231
10.6小結232
第11章基礎評估方法——假設檢驗234
11.1卡方檢驗234
11.2 T檢驗236
11.3 Z檢驗和F檢驗238
11.4小結241
參考文獻242
作者介紹
宋亞統,美團點評配送事業部高級算法工程師,2017年獲得中國科學院大學碩士學位。
他目前主要負責基於位置的服務(Location-Based Service,LBS)算法研發工作。
他熱愛人工智能並擅長寫作,在職期間獲得8項算法發明專利,對機器學習算法有著深入的研究和豐富的實踐經驗。