圖解機器學習算法 (全彩印刷)
內容描述
本書基於豐富的圖示,詳細介紹了有監督學習和無監督學習的17種算法,包括線性回歸、正則化、邏輯回歸、支持向量機、核方法、樸素貝葉斯、隨機森林、神經網絡、KNN、PCA、LSA、NMF、LDA、k-means算法、混合高斯分佈、LLE和t-SNE。書中針對各算法均用Python代碼進行了實現,讀者可一邊運行代碼一邊閱讀,從而加深對算法的理解。
目錄大綱
第1章
機器學習基礎1
1.1機器學習概要2
什麼是機器學習2
機器學習的種類3
機器學習的應用8
1.2機器學習的步驟9
數據的重要性9
有監督學習(分類)的例子11
無監督學習(聚類)的例子16
可視化18
圖形的種類和畫法:使用Matplotlib顯示圖形的方法22
使用pandas理解和處理數據30
本章小結36
第2章
有監督學習37
2.1算法1:線性回歸38
概述38
算法說明39
詳細說明41
2.2算法2:正則化45
概述45
算法說明48
詳細說明50
2.3算法3:邏輯回歸52
概述52
算法說明53
詳細說明55
2.4算法4 :支持向量機58
概述58
算法說明59
詳細說明60
2.5算法5:支持向量機(核方法) 63
概述63
算法說明64
詳細說明65
2.6算法6:樸素貝葉斯68
概述68
算法說明70
詳細說明74
2.7算法7:隨機森林76
概述76
算法說明77
詳細說明80
2.8算法8:神經網絡81
概述81
算法說明83
詳細說明86
2.9算法9:KNN 88
概述88
算法說明89
詳細說明90
第3章
無監督學習93
3.1算法10:PCA 94
概述94
算法說明95
詳細說明98
3.2算法11:LSA 99
概述99
算法說明100
詳細說明104
3.3算法12:NMF 105
概述105
算法說明106
詳細說明108
3.4算法13:LDA 111
概述111
算法說明112
詳細說明114
3.5算法14:k-means算法117
概述117
算法說明117
詳細說明119
3.6算法15:混合高斯分佈122
概述122
算法說明123
詳細說明126
3.7算法16:LLE 127
概述127
算法說明128
詳細說明131
3.8算法17:t-SNE 133
概述133
算法說明134
詳細說明136
第4章
評估方法和各種數據的處理139
4.1評估方法140
有監督學習的評估140
分類問題的評估方法140
回歸問題的評估方法148
均方誤差和決定係數指標的不同152
與其他算法進行比較152
超參數的設置154
模型的過擬合155
防止過擬合的方法155
將數據分為訓練數據和驗證數據156
交叉驗證158
搜索超參數160
4.2文本數據的轉換處理163
基於單詞出現次數的轉換163
基於tf-idf的轉換164
應用於機器學習模型165
4.3圖像數據的轉換處理167
直接將像素信息作為數值使用167
將轉換後的向量數據作為輸入來應用機器學習模型168
第5章
環境搭建171
5.1 Python 3的安裝172
Windows 172
macOS 172
Linux 173
使用Anaconda在Windows上安裝174
5.2虛擬環境175
通過官方安裝程序安裝Python的情況175
通過Anaconda安裝Python的情況177
5.3第三方包的安裝178
什麼是第三方包178
安裝第三方包的方法178
參考文獻180
作者介紹
秋庭伸也(作者)
日本早稻田大學碩士畢業,目前在Recruit Communications公司擔任技術負責人。
杉山阿聖(作者)
具有多年研發經驗,目前在AI創業公司SENSY擔任機器學習研究員。
寺田學(作者)
CMS Communications公司董事長、日本PyCon會議組織者、Plone基金會大使、Python工程師發展協會顧問理事、PSF(Python軟件基金會)貢獻成員。
鄭明智(譯者)
智慧醫療工程師,翻譯經驗豐富,有《白話機器學習的數學》《用Python動手學機器學習》等多部譯著。