數據分析與挖掘算法:Python實戰
內容描述
本書是一本介紹數據分析相關算法的學習指南,主要包括數據分析及數據挖掘相關概念介紹、數據思維及各種數據分析算法的原理及實現方法。本書的每個數據分析算法都介紹了數學原理、Python代碼實現以及實戰案例,內容豐富、容易理解。本書共9章,第1章介紹了數據挖掘與數據分析、機器學習之間的關系;第2 章介紹了數據分析人員應該具備的數據思維,包括數據思維認知、數據挖掘“定律”;第3~9章介紹了各種數據分析算法的原理、實現方法及實戰案例,其中包括邏輯回歸、決策樹、樸素貝葉斯、聚類分析、關聯規劃、人工神經網絡、集成學習。 本書適合從事數據分析工作的讀者自學,也可作為產品經理、運營人員、市場人員和對數據分析感興趣的讀者的參考用書。
目錄大綱
第1章 數據分析概述 1
1.1 什麼是數據挖掘 2
1.2 數據挖掘與數據分析的關係 6
1.3 數據挖掘與機器學習的關係 8
1.4 機器學習算法簡介 13
第2章 數據思維 19
2.1 數據思維認知 21
2.2 數據思維認知的主觀性與客觀性 26
2.3 數據挖掘“定律” 29
第3章 邏輯回歸 37
3.1 邏輯回歸基礎:從線性回歸到邏輯回歸 38
3.2 邏輯回歸函數構建 41
3.3 邏輯回歸問題求解 46
3.4 邏輯回歸模型評估 49
3.5 Python代碼實現 55
第4章 決策樹 65
4.1 決策樹基礎 66
4.2 決策樹算法 70
4.3 Python代碼實現 86
第5章 樸素貝葉斯 95
5.1 概率論基礎 96
5.2 從貝葉斯公式到樸素貝葉斯分類 100
5.3 Python代碼實現 106
第6章 聚類分析 113
6.1 聚類分析基礎 115
6.2 聚類算法 121
6.3 Python代碼實現 128
第7章 關聯規則 137
7.1 關聯規則基礎 140
7.2 關聯規則算法 143
7.3 Python代碼實現 147
第8章 人工神經網絡 151
8.1 人工神經網絡基礎 153
8.2 BP(誤差逆傳播前饋)神經網絡 158
8.3 Python代碼實現 164
第9章 集成學習 169
9.1 集成學習基礎 170
9.2 集成學習算法 174
參考資料 181
作者介紹
張曉東,碩士研究生,深耕數據分析領域近十年。
曾任商業分析師、大數據分析師、算法工程師等職位,主導及參與近20個諮詢項目。
曾任內蒙古農業大學外聘大數據講師,受聘於呼和浩特市大數據管理局專家庫專家