
Python 機器學習及實踐 --- 從零開始通往 Kaggle 競賽之路
內容描述
<內容簡介>
本書面向所有對機器學習與數據挖掘的實踐及競賽感興趣的讀者,從零開始,以Python編程語言為基礎,在不涉及大量數學模型與復雜編程知識的前提下,逐步帶領讀者熟悉並且掌握當下流行的機器學習、數據挖掘與自然語言處理工具,如Scikit-learn、NLTK、Pandas、gensim、XGBoost、Google Tensorflow等。
全書共分4章。第1章簡介篇,介紹機器學習概念與Python編程知識;第2章基礎篇,講述如何使用Scikit-learn作為基礎機器學習工具;第3章進階篇,涉及怎樣借助高級技術或者模型進一步提升既有機器學習系統的性能;第4章競賽篇,以Kaggle平臺為對象,幫助讀者一步步使用本書介紹過的模型和技巧,完成三項具有代表性的競賽任務。
<章節目錄>
第1章簡介篇............................................. .................1
1.1機器學習綜述............................ ..................................1
1.1.1任務........... .................................................. .......3
1.1.2經驗...................................... ..............................5
1.1.3性能............... .................................................. ...5
1.2 Python編程庫.......................................... ....................8
1.2.1為什麼使用Python....................... .................................8
1.2.2 Python機器學習的優勢........ ............................................9
1.2.3 NumPy & SciPy................................................. .........10
1.2.4 Matplotlib.................................... .........................11
1.2.5 Scikit-learn.................. ........................................11
1.2.6 Pandas..... .................................................. ..........11
1.2.7 Anaconda................................... ............................12
1.3 Python環境配置................. ..........................................12
1.3.1 Windows系統環境. .................................................. .....12
1.3.2 Mac OS系統環境..................................... ...................17
1.4 Python編程基礎.......................... .................................18
1.4.1 Python基本語法.......... ...............................................19
1.4. 2 Python數據類型.............................................. ..........20
1.4.3 Python數據運算................................. .......................22
1.4.4 Python流程控制.................... ....................................26
1.4.5 Python函數(模塊)設計.... ............................................28
1.4.6 Python編程庫(包)的導入............................................ ..29
1.4.7 Python基礎綜合實踐........................................ ............30
1.5章末小結................................. .............................33
第2章基礎篇............................................. .................34
2.1監督學習經典模型........................... ..............................34
2.1.1分類學習.............. .................................................35
2.1.1.1線性分類器
2.1.1.2支持向量機(分類)
2.1.1.3樸素貝葉斯
2.1.1.4 K近鄰(分類)
2.1.1.5決策樹
2.1.1.6集成模型(分類)
2.1.2回歸預測.. .................................................. ...........64
2.1.2.1線性回歸器
2.1.2.2支持向量機(回歸)
2.1.2.3 K近鄰(回歸)
2.1.2.4回歸樹
2.1.2.5集成模型(回歸)
2.2無監督學習經典模型.............................................. .........81
2.2.1數據聚類.................................. ....................81
2.2.1.1 K均值算法
2.2.2特徵降維................. ..............................................91
2.2.2.1主成分分析
2.3章末小結........................................... ......................97
第3章進階篇.............................................. .................98
3.1模型實用技巧............................ .................................98?
3.1.1特徵提升.......... .................................................. ...99
3.1.2模型正則化........................................ ....................111
3.1.3模型檢驗........................ ......................................121
3.1.4超參數搜索..... .................................................. .....122
3.2流行庫/模型實踐...................................... ...................129
3.2.1自然語言處理包(NLTK).................... ............................131
3.2.2詞向量(Word2Vec)技術............ ....................................133
3.2.3 XGBoost模型........ .................................................. .138
3.2.4 Tensorflow框架........................................... .............140
3.3章末小結................................ ................................152
第4章實戰篇............................................. .................153
4.1 Kaggle平臺簡介............................ ..............................153
4.2 Titanic罹難乘客預測.............. .......................................157
4.3 IMDB影評得分估計..... .................................................. .165
4.4 MNIST手寫體數字圖片識別.......................................... .......174
4.5章末小結...................................... ..........................180
後記................................................. ....................181
參考文獻................................................ .................182