金融中的機器學習

金融中的機器學習

作者: [英]簡尼斯·克拉斯(Jannes Klaas)
出版社: 人民郵電
出版在: 2021-07-01
ISBN-13: 9787115563095
ISBN-10: 7115563098
裝訂格式: 平裝
總頁數: 390 頁





內容描述


機器學習是設計與應用算法的科學,可從數據中進行學習和預測,其應用已經非常普遍。金融領域集中了大量的交易數據,為人工智能技術的運用奠定了良好的數據基礎。本書面向金融領域的讀者,介紹了機器學習技術的原理與實踐。
本書包括10章,介紹了神經網絡算法、結構化數據的處理、電腦視覺處理技術、時間序列分析、自然語言處理、生成模型的應用、強化學習技術、數據建模與調試、貝葉斯推理和概率編程等內容。
本書由資深金融從業者編寫,融合了其在金融項目中關於機器學習的實踐經驗,適合金融領域的數據科學家、數據分析師、金融科技公司的技術研發人員以及對金融領域的機器學習技術感興趣的讀者閱讀。


目錄大綱


第1章神經網絡和基於梯度的優化1
1.1本書的內容概要2
1.2什麼是機器學習3
1.3監督學習4
1.4非監督學習5
1.5強化學習5
1.5 .1極其有效的數據6
1.5.2模型即是錯6
1.6創建工作區8
1.7使用Kaggle內核8
1.8使用AWS深度學習AMI 12
1.9近似函數12
1.10前向傳遞13
1.11邏輯回歸器14
1.12優化模型參數17
1.13評估模型損失18
1.13.1梯度下降19
1.13.2反向傳播20
1.13.3參數更新22
1 .13.4階段小結22
1.14深度網絡25
1.15 Keras簡介29
1.15.1導入Keras庫30
1.15.2 Keras中的雙層模型30
1.15.3 Keras和TensorFlow 33
1 .16張量和計算圖33
1.17練習35
1.18本章小結35
第2章機器學習在結構化數據中的應用37
2.1數據38
2.2啟發式模型、基於特徵的模型和E2E模型40
2.3機器學習軟件棧41
2.4啟發式方法42
2.4.1使用啟發式模型來預測42
2.4.2 F1分數43
2.4.3基於混淆矩陣的評價44
2.5特徵工程方法45
2.5.1特徵源於直覺—詐騙者永不眠46
2.5.2專家視角—轉賬後提款48
2.5. 3統計奇事—餘額中的錯誤48
2.6 Keras庫的數據準備49
2.6.1 one-hot編碼50
2.6.2實體嵌入(entity embeddings) 51
2.7使用Keras創建預測模型54
2.7.1提取目標55
2.7.2創建測試集55
2.7.3創建驗證集56
2.7.4訓練數據的過採樣56
2.7.5構建模型57
2.8基於決策樹方法的簡要入門61
2.8.1一個簡單的決策樹61
2.8.2隨機森林62
2.8.3 XGBoost 63
2.9 E2E模型64
2.10練習65
2.11本章小結65
第3章計算機視覺的應用66
3.1卷積神經網絡68
3.1.1過濾MNIST數據集68
3.1.2第二個過濾器70
3.2彩色圖片的過濾技術71
3.3 Keras ConvNet組成模塊72
3.3.1 Conv2D 72
3.3.2最大池化76
3.3.3 Flatten層77
3.3.4 Dense層78
3.3.5訓練MNIST 78
3.4神經網絡的延展83
3.4.1動量83
3.4.2 Adam優化器84
3.4.3正則化(regularization) 85
3.4.4失效(dropout) 88
3.4.5批歸一化(BatchNorm) 90
3.5採用大圖片數據集91
3.6採用預訓練模型93
3.6.1修改VGG16 95
3.6.2隨機圖像增強96
3.7模塊度權衡99
3.8計算機視覺不止分類100
3.8.1人臉識別100
3.8.2邊框預測102
3.9練習104
3.10本章小結104
第4章理解時間序列106
4.1數據的可視化與Pandas準備107
4.1.1匯總全局特徵統計109
4.1.2檢查採樣時間序列112
4.1.3不同平穩特性115
4.1.4為什麼平穩性重要116
4.1.5讓時間序列具有平穩性116
4.1.6何時忽略平穩性問題118
4.2快速傅里葉變換118
4.3自相關121
4.4構建訓練和測試方案123
4.5回測124
4.6中位數預測126
4.7 ARIMA模型128
4.8卡曼濾波131
4.9神經網絡預測136
4.10 Conv1D 142
4.11因果卷積和擴張卷積143
4.12簡單的RNN 145
4.13 LSTM 146
4.14循環dropout 149
4.15貝葉斯深度學習150
4.16練習153
4.17本章小結154
第5章用自然語言處理解析文本數據155
5.1 spaCy的入門指南156
5.2命名實體識別158
5.3詞性標記166
5.4基於規則的匹配168
5.4.1在匹配器中添加自定義函數170
5.4.2匹配器添加到pipeline中172
5.4.3基於規則和學習相結合的系統172
5.5正則表達式173
5.5.1 Python正則表達式174
5.5.2 Pandas正則表達式175
5.5.3何時使用正則表達式175
5.6文本分類任務175
5.7準備數據176
5.7.1清理字符176
5.7.2詞形還原177
5.7.3制定目標178
5.7.4準備訓練集和測試集179
5.8詞袋模型179
5.9主題模型181
5.10單詞嵌入183
5.10.1針對單詞向量訓練的預處理184
5.10.2加載預先訓練的單詞向量186
5.10 .3單詞向量的時間序列模型190
5.11具有單詞嵌入的文檔相似度191
5.12快速瀏覽Keras函數API 192
5.13注意力機制195
5.14注意力模塊197
5.15 seq2seq模型199
5 .15.1 seq2seq架構概述199
5.15.2數據200
5.15.3字符編碼202
5.15.4構建推斷模型206
5.15.5翻譯208
5.16練習210
5.17本章小結211
第6章生成模型的應用212
6.1理解自編碼器213
6.1.1 MNIST的自編碼器214
6.1.2信用卡自編碼器217
6. 2使用t-SNE可視化隱空間221
6.3變分自編碼器225
6.3.1 MNIST實例226
6.3.2使用Lambda層227
6.3.3 Kullback-Leibler散度228
6.3. 4創建自定義損失230
6.3.5使用VAE生成數據231
6.3.6針對端到端詐騙檢測系統的VAE 233
6.4時間序列的VAE 234
6.5 GAN 236
6.5.1 MNIST GAN 238
6.5.2理解GAN隱向量245
6.5.3 GAN訓練技巧245
6.6使用更少的數據—主動學習248
6.6.1高效使用標籤預算248
6.6.2採用機器來為人類打標籤250
6.6.3未打標籤數據的偽標籤251
6.6.4使用生成模型251
6.7用於詐騙檢測的SGAN 251
6.8練習258
6.9本章小結258
第7章金融市場中的強化學習259
7.1 “接水果”遊戲—強化學習的快速指南260
7.1.1 Q-learning將強化學習變成監督學習262
7.1.2定義Q-learning模型265
7.1.3訓練玩“接水果”遊戲266
7.2馬爾可夫過程和貝爾曼方程—強化學習的形式化介紹268
7.3優勢動作評論(A2C)模型273
7.3.1學習平衡275
7.3.2學習交易286
7.4進化策略和基因算法290
7.5強化學習工程的實用建議292
7.5.1設計良好的收益函數292
7.5.2強魯棒性的強化學習294
7.6強化學習技術前沿295
7.6.1多代理強化學習295
7.6.2學習如何去學習296
7.6.3通過強化學習理解大腦297
7.7練習298
7. 8本章小結298
第8章調試和發布產品299
8.1調試數據300
8.1.1如何查看數據是否勝任任務300
8.1.2沒有足夠數據該怎麼辦302
8.1.3單元測試數據302
8.1.4保證數據隱私並遵守法規306
8.1.5為訓練準備數據308
8.1.6了解何種輸入導致何種預測309
8.2調試模型311
8.2.1 Hyperas搜索超參311
8.2.2高效的學習率搜索316
8.2.3學習率調度318
8.2.4 TensorBoard監控訓練320
8.2.5梯度爆炸和消失324
8.3部署325
8.3.1快速上線326
8.3.2理解和監控指標327
8.3.3了解數據的來源328
8.4性能建議329
8.4.1使用合適的硬件329
8.4.2使用分佈式訓練和TF估計器329
8.4.3使用CuDNNLSTM優化層331
8.4.4優化管道331
8.4.5使用Cython加速代碼334
8.4.6緩存頻繁的請求336
8.5練習336
8.6本章小結336
第9章挑戰偏見338
9.1機器學習中不公平的來源339
9. 2法律視角340
9.3量化公平341
9.4訓練公平344
9.5因果學習354
9.5.1獲得因果模型355
9.5.2工具變量356
9.5.3非線性因果模型357
9.6解釋模型來確保公平359
9.7不公平則是複雜系統的失敗364
9.7.1複雜系統本質上是危險系統365
9.7.2諸多故障引發災難365
9.7.3複雜系統以降級模式運行365
9.7.4人工操作既能引發事故也能防止事故365
9.7.5無事故操作要求有故障經驗365
9.8開發公平模型的檢查清單366
9.8.1模型開發人員的目標是什麼366
9.8.2數據存在偏見嗎366
9.8.3錯誤是否有偏見366
9.8.4如何整合反饋367
9.8 .5模型可解釋嗎367
9.8.6模型部署後會發生什麼367
9.9練習367
9.10本章小結368
第10章貝葉斯推理和概率編程369
10.1貝葉斯推理入門指南370
10.1.1扁平先驗371
10.1.2 < 50%先驗373
10.1.3先驗與後驗374
10.1.4馬爾可夫鏈蒙特卡羅算法376
10.1. 5 Metropolis-Hastings MCMC 381
10.1.6從概率編程到深度概率編程386
10.2本章小結387
結束語388
推薦讀物389


作者介紹


簡尼斯.克拉斯(Jannes Klaas)是一名擁有金融學和經濟學背景的量化分析師。
他曾主導過兩個機器學習訓練營項目,也同研發數據驅動類應用的公司和交易策略類公司有過合作。
目前,他的研究領域包括系統風險和大規模自動化的知識挖掘。




相關書籍

Machine Learning Algorithms: Popular algorithms for data science and machine learning, 2nd Edition

作者 Giuseppe Bonaccorso

2021-07-01

Python 基礎與物件導向程式設計

作者 葉建華

2021-07-01

信號與系統——基於MATLAB的方法

作者 譚鴿偉 馮桂 黃公彞 胡朝煒

2021-07-01