機器學習實踐:基於Python進行數據分析
內容描述
本書是一本創建真實世界智能係統的問題解決指南。
提供了一種包含概念、實踐、實際示例和代碼示例的綜合方法,
教給讀者理解和解決機器學習不同問題所需的重要技能。
通過介紹Python機器學習生態系統中的真實案例研究,
教授成為一個成功的實踐者所必需的機器學習技術。
本書還側重於機器學習的基礎知識,以解決不同領域的真實世界案例,
包括生物醫學信號分析、醫療保健、安全、經濟和金融。
此外,它涵蓋了廣泛的機器學習模型,包括回歸、分類和預測。
目錄大綱
譯者序
前言
致謝
第1章 簡介
1.1 什麼是機器學習
1.1.1 為什麼需要使用機器學習
1.1.2 做出數據驅動決策
1.1.3 定義以及關鍵術語
1.1.4 機器學關鍵任務
1.1.5 機器學習技術
1.2 機器學習框架
1.2.1 數據收集
1.2.2 數據描述
1.2.3 探索性數據分析
1.2.4 數據質量分析
1.2.5 數據準備
1.2.6 數據集成
1.2.7 數據整理
1.2.8 特徵縮放和特徵提取
1.2.9 特徵選擇及降維
1.2.10 建模
1.2.11 選擇建模技術
1.2.12 構建模型
1.2.13 模型評估及調優
1.2.14 實現以及檢驗已經創建的模型
1.2.15 監督學習框架
1.2.16 無監督學習框架
1.3 性能評估
1.3.1 混淆矩陣
1.3.2 F值分析
1.3.3 ROC分析
1.3.4 Kappa統計量
1.3.5 度量了什麼
1.3.6 如何度量
1.3.7 如何解釋估計
1.3.8 scikit-learn中的k折交驗證
1.3.9 如何選擇正確的算法
1.4 Python機器學習環境
1.4.1 缺陷
1.4.2 缺點
1.4.3 NumPy庫
1.4.4 Pandas
1.5 本章小結
1.6 參考文獻
第2章 數據預處理
2.1 簡介
2.2 特徵提取和轉換
2.2.1 特徵類型
2.2.2 統計特徵
2.2.3 結構化特徵
2.2.4 特徵轉換
2.2.5 閾值化和離散化
2.2.6 數據操作
2.2.7 標準化
2.2.8 歸一化和校準
2.2.9 不完整的特徵
2.2.10 特徵提取的方法
2.2.11 使用小波變換進行特徵提取
2.3 降維
2.3.1 特徵構造和選擇
2.3.2 單變量特徵選擇
2.3.3 遞歸式特徵消除
2.3.4 從模型選擇特徵
2.3.5 主成分分析
2.3.6 增量PCA
2.3.7 核PCA
2.3.8 鄰近成分分析
2.3.9 獨立成分分析
2.3.10 線性判別分析
2.3.11 熵
2.4 基於聚類的特徵提取和降維
2.5 參考文獻
第3章 機器學習技術
3.1 簡介
3.2 什麼是機器學習
3.2.1 理解機器學習
3.2.2 如何讓機器學習
3.2.3 多學科領域
3.2.4 機器學習問題
3.2.5 機器學目標
3.2.6 機器學挑戰
3.3 Python庫
3.3.1 scikit-learn
3.3.2 TensorFlow
3.3.3 Keras
3.3.4 使用Keras構建模型
3.3.5 自然語言工具包
3.4 學習場景
3.5 監督學習算法
3.5.1 分類
3.5.2 預報、預測和回歸
3.5.3 線性模型
3.5.4 感知機
3.5.5 邏輯回歸
3.5.6 線性判別分析
3.5.7 人工神經網絡
3.5.8 k近鄰
3.5.9 支持向量機
3.5.10 決策樹分類器
3.5.11 樸素貝葉斯
3.5.12 集成學習
3.5.13 bagging算法
3.5.14 隨機森林
3.5.15 boosting算法
3.5.16 其他集成方法
3.5.17 深度學習
3.5.18 深度神經網絡
3.5.19 循環神經網絡
3.5.20 自編碼器
3.5.21 長短期記憶網絡
3.5.22 卷積神經網絡
3.6 無監督學習
3.6.1 k均值算法
3.6.2 輪廓係數
3.6.3 異常檢測
- 關聯規則挖掘
3.7 強化學習
3.8 基於實例的學習
3.9 本章小結
3.10 參考文獻
第4章 醫療保健分類示例
4.1 簡介
4.2 腦電圖信號分析
4.2.1 癲癇症的預測和檢測
4.2.2 情緒識別
4.2.3 局灶性和非局灶性癲癇EEG信號的分類
4.2.4 偏頭痛檢測
4.3 EMG信號分析
4.3.1 神經肌肉疾病的診斷
4.3.2 假體控制中的EMG信號
4.3.3 康復機器人中的EMG信號
4.4 心電圖信號分析
4.5 人類活動識別
4.5.1 基於傳感器的人類活動識別
4.5.2 基於智能手機的人類活動識別
4.6 用於癌症檢測的微陣列基因表達數據分類
4.7 乳腺癌檢測
4.8 預測胎兒風險的心電圖數據分類
4.9 糖尿病檢測
4.10 心髒病檢測
4.11 慢性腎髒病的診斷
4.12 本章小結
4.13 參考文獻
第5章 其他分類示例
5.1 入侵檢測
5.2 檢測
5.3 垃圾郵件檢測
5.4 信用評分
5.5 信用卡欺詐檢測
5.6 使用CNN進行手寫數字識別
5.7 使用CNN進行Fashion-MNIST圖像分類
5.8 使用CNN進行CIFAR圖像分類
5.9 文本分類
5.10 本章小結
5.11 參考文獻
第6章 回歸示例
6.1 簡介
6.2 股票市場價格指數收益預測
6.3 通貨膨脹預測
電力負荷預測
6.5 風速預測
6.6 旅遊需求預測
6.7 房價預測
6.8 單車使用情況預測
6.9 本章小結
6.10 參考文獻
第7章 聚類示例
7.1 簡介
7.2 聚類
7.2.1 評估聚類輸出
7.2.2 聚類分析的應用
7.2.3 可能的聚類數
7.2.4 聚類
作者介紹
阿卜杜勒哈密特·蘇巴西(Abdulhamit Subasi)教授是機器學習、數據挖掘和生物醫學信號處理方面的專家,發表了150多篇期刊和會議論文。他在許多機構工作過,並在佐治亞理工學院擔任過研究員。 2018年5月,他被授予女王埃法特傑出研究獎。自2015年以來,他一直在沙特阿拉伯埃法特大學擔任信息系統教授。他目前的研究項目與生物醫學信號處理和數據分析相關。