商用機器學習:數據科學實踐
內容描述
今天
商業企業的所有高管和從業者
都知道如何使用電腦
明天
他們就一定要熟知大數據的真正含義,
更要知道機器學習如何在商業中使用!
機器學習作為人工智能最值得期待的內容,也最具商業價值。本書是金融工程和風險管理大師約翰·赫爾教授的最新著作。全書深入淺出地講解了機器學習的核心內容、最常用和流行的算法以及大量機器學習的商用案例,對技術性要求很低,讓讀者很容易從商業的角度理解其技術內涵,特別適合機器學習的初學者和業界人士閱讀,也非常適合大學商學院教學,幫助其學生瞭解“數據科學家”這個職業。
特別地,作者在書中同時使用Excel工作表和Python代碼,方便初學者先從容易的Excel入手,按照自己的節奏,再慢慢轉向Python,書中的相關數據、工作表和Python代碼都可在指定網站查詢。另外,本書還配有相關的教輔資料、PPT,以供參考。
目錄大綱
作者簡介
譯者和審校者簡介
譯者序
前言
第1章 引言 / 1
1.1 關於本書及相關材料 / 4
1.2 機器學習分類 / 5
1.3 驗證和測試 / 7
1.4 數據清洗 / 14
1.5 貝葉斯定理 / 17
第2章 無監督學習 / 23
2.1 特徵縮放 / 24
2.2 k-均值算法 / 25
2.3 設置k值 / 28
2.4 維度災難 / 31
2.5 國家風險 / 32
2.6 其他聚類方法 / 39
2.7 主成分分析 / 41
第3章 監督學習:線性回歸 / 49
3.1 線性回歸:單特徵 / 50
3.2 線性回歸:多特徵 / 52
3.3 分類特徵 / 54
3.4 正則化 / 55
3.5 嶺回歸 / 56
3.6 套索回歸 / 61
3.7 彈性網絡回歸 / 64
3.8 房價數據模型結果 / 65
3.9 邏輯回歸 / 71
3.10 邏輯回歸的準確性 / 72
3.11 信貸決策中的運用 / 74
3.12 k-近鄰算法 / 80
第4章 監督學習:決策樹 / 84
4.1 決策樹的本質 / 85
4.2 信息增益測度 / 86
4.3 信息決策應用 / 88
4.4 樸素貝葉斯分類器 / 94
4.5 連續目標變量 / 99
4.6 集成學習 / 102
第5章 監督學習:支持向量機 / 108
5.1 線性SVM分類 / 108
5.2 關於軟間隔的修改 / 115
5.3 非線性分離 / 117
5.4 關於連續變量的預測 / 119
第6章 監督學習:神經網絡 / 125
6.1 單層神經網絡 / 125
6.2 多層神經網絡 / 129
6.3 梯度下降算法 / 131
6.4 梯度下降算法的變形 / 136
6.5 迭代終止規則 / 138
6.6 應用於衍生產品 / 139
6.7 捲積神經網絡 / 140
6.8 遞歸神經網絡 / 142
附錄6A 反向傳播算法 / 146
第7章 強化學習 / 148
7.1 多臂老虎機問題 / 149
7.2 環境變化 / 156
7.3 Nim游戲博弈 / 158
7.4 時序差分學習 / 162
7.5 深度Q學習 / 164
7.6 應用 / 165
第8章 社會問題 / 170
8.1 數據隱私 / 171
8.2 偏見 / 172
8.3 道德倫理 / 174
8.4 透明度 / 176
8.5 對抗機器學習 / 177
8.6 法律問題 / 178
8.7 人類與機器 / 179
部分習題答案 / 182
術語表 / 198
作者介紹
约翰·赫尔
加拿大多伦多大学罗特曼管理学院教授。在本书出版之前,他曾在金融衍生产品和风险管理领域出版了三本畅销书,因其著作侧重于应用,故在业界和学术领域都享有盛名。赫尔教授还是罗特曼管理学院金融创新实验室(FinHub)主任,该实验室负责研究金融创新产品并开发诸多相关教学资料。他还曾担任北美、日本和欧洲诸多公司的顾问,并获得过许多教学奖,包括多伦多大学著名的诺斯罗普·弗莱奖(Northrop Frye Award)。