Python 機器學習實戰:真實智能案例實踐指南 (Practical Machine Learning with Python: A Problem-Solver's Guide to Building Real-World Intelligent Systems)
內容描述
本書幫你掌握通過機器學習和深度學習來識別和解決複雜問題所需的基本技能。
本書使用了流行的Python機器學習生態系統中的真實示例,將成為你在學習機器學習的藝術和科學並成為一名成功的從業者道路上的完美伴侶。
本書中使用的概念、技術、工具、框架和方法將教會你如何成功思考、設計、構建和執行機器學習系統和項目,
並利用這些知識解決一些來自不同領域的實際問題,包括零售、運輸、電影、音樂、計算機視覺、藝術和金融。
本書將教會你解決自己遇到的機器學習問題!
本書適合人工智能、機器學習、深度學習相關行業的從業者和學習者閱讀。
目錄大綱
目錄
原書序言
原書前言
譯者簡介
第1部分理解機器學習
第1章機器學習基礎// 2
11機器學習的需求// 3
12理解機器學習// 6
13計算機科學// 12
14數據科學/ / 14
15數學// 15
16統計學// 20
17數據挖掘// 22
18人工智能// 22
19自然語言處理// 23
110深度學習// 24
111機器學習方法// 29
112監督學習// 30
113無監督學習// 33
114半監督學習// 36
115強化學習// 37
116批量學習// 37
117在線學習// 38
118基於實例的學習// 38
119基於模型的學習// 39
120 CRISP-DM處理模型// 39
121構建機器智能// 45
122真實案例研究:預測學生獲取推薦// 47
123機器學習的挑戰// 55
124機器學習的現實應用// 55
125總結// 56
第2章Python機器學習生態系統// 57
21 Python簡介// 57
22 Python機器學習生態系統簡介// 62
23總結// 100
第2部分機器學習流程
第3章數據的處理、重整以及可視化// 102
31數據收集// 103
32數據描述// 116
33數據重整// 117
34數據匯總// 128
35數據可視化// 130 36
總結// 152
第4章特徵工程和特徵選擇// 153
41特徵:更好地理解你的數據// 154
42重溫機器學習流程// 155
43特徵提取和特徵工程// 156
44數值型數據的特徵工程// 160
45分類型數據的特徵工程// 174
46文本型數據的特徵工程// 183
47時態型數據的特徵工程// 193
48圖像型數據的特徵工程// 197
49特徵縮放// 211
410特徵選擇// 214
411特徵降維// 221
412總結// 224
第5章構建、調優和模型的部署// 225
51構建模型// 226
52模型評估// 239
53模型調優// 248
54模型解釋// 259
55模型部署// 265
56總結// 267
第3部分真實案例研究
第6章共享單車趨勢分析// 270
61共享單車數據集// 270
62問題陳述// 271
63探索性數據分析// 271
64回歸分析// 278
65建模// 280
66下一步// 291
67總結// 292
第7章電影影評的情感分析// 293
71問題陳述// 294
72設置依賴項// 294
73獲取數據// 295
74文字的預處理與標準化// 295
75無監督的以詞典為基礎的模型// 298
76使用監督學習進行情感分類// 306
77傳統的有監督的機器學習模型// 308
78較新的有監督的深度學習模型// 310
79高級的有監督的深度學習模型// 316
710分析情感的因果關係// 323
711總結// 332
第8章顧客分類和有效的交叉銷售/333/
81在線零售交易記錄數據集// 333
82探索性數據分析// 334
83顧客分類// 337
84交叉銷售// 350
85總結// 361
第9章分析酒的類型和質量// 362
91問題陳述// 362
92設置依賴項// 363
93獲取數據// 363
94探索性數據分析// 364
95預測建模// 378
96預測葡萄酒類型// 379
97預測葡萄酒質量// 385
98總結// 397
第10章分析音樂趨勢和推薦// 398
101百萬歌曲數據集品味畫像// 398
102探索性數據分析// 399
103推薦引擎// 407
104推薦引擎庫的注意事項// 415
105總結// 416
第11章預測股票和商品價格// 417
111時序數據及時序分析// 417
112預測黃金價格// 423
113股票價格預測// 432
114總結// 445
第12章計算機視覺深度學習// 447
121卷積神經網絡// 447
122使用CNN進行圖像分類// 448
123使用CNN的藝術風格轉換// 457
124總結// 467
作者介紹
Dipanjan Sarkar
英特爾公司的數據科學家,班加羅爾國際信息技術學院的信息技術碩士,
主要負責數據科學研究與分析、商業智能、實際項目和大型智能係統構建等研究、開發工作。
他多年來從事分析工作,擅長統計、預測和文本分析,對數據科學和教育充滿熱情,
也是Springboard教育平台的數據科學導師,幫助從業者提高數據科學和機器學習等領域的技能。
他還撰寫了多本關於R、Python、機器學習和數據分析的著作。
此外,他還是相關書籍的技術審校者,並擔任Coursera的課程測試員。
此外他還熱衷於研究新技術、金融市場、顛覆性初創企業、數據科學、人工智能和深度學習。
Raghav Bali
英特爾公司的數據科學家,班加羅爾國際信息技術學院的信息技術碩士,致力於推動主動的、數據驅動的IT項目。
他主要從事數據科學與分析、商業智能以及基於機器學習的可擴展解決方案開發等工作,
還曾在一些全球領先的企業中從事過ERP和財務項目開發等工作。
他也是一位技術愛好者,喜歡研究新工具和技術。他還著有關於R、機器學習和數據分析的著作。
Tushar Sharma
英特爾公司的數據科學家,班加羅爾國際信息技術學院的信息技術碩士。
他的工作涉及使用大量基礎結構數據進行大規模開發分析的解決方案。
他曾在金融領域工作,為知名金融公司開發可擴展的機器學習解決方案。
他精通Python、R,以及Spark和Hadoop等大數據框架。
他還著有關於R和社交媒體分析的著作。