Python機器學習編程與實戰

Python機器學習編程與實戰

作者: 林耀進 張良均
出版社: 人民郵電
出版在: 2020-07-01
ISBN-13: 9787115532534
ISBN-10: 7115532532
總頁數: 272 頁





內容描述


本書採用常用技術與真實案例相結合的講解方式,深入淺出地介紹了Python機器學習應用的主要內容。全書共8章,內容包括Python概述、NumPy數值計算、pandas基礎、pandas進階、Matplotlib繪圖、scikit-learn、餐飲企業綜合分析與預測、通信運營商客戶流失分析與預測。前6章設置了選擇題、填空題和操作題,後兩章設置了操作題,希望通過練習和操作實踐,讀者可以鞏固所學的內容。本書可以作為高校大數據或人工智能專業的教材,也可作為機器學習愛好者的自學用書。


目錄大綱


第 1章 Python概述 11.1 Python簡介 11.1.1 Python語言 11.1.2 Python與機器學習 11.1.3 Python環境配置 21.2 Python基礎知識 51.2.1 固定語法 51.2.2 運算符 61.2.3 數據類型 91.2.4 Python I/O 141.3 控制語句 171.3.1 條件語句 181.3.2 循環語句 201.4 函數 22小結 25課後習題 26第 2章 NumPy數值計算 282.1 ndarray的創建與索引 282.1.1 創建ndarray 282.1.2 ndarray的索引和切片 332.2 ndarray的基礎操作 362.2.1 變換ndarray的形態 362.2.2 排序與搜索 422.3 ufunc 462.3.1 ufunc的廣播機制 462.3.2 常用ufunc運算 47小結 54課後習題 54第3章 pandas基礎 563.1 pandas常用類 563.1.1 Series 563.1.2 DataFrame 603.1.3 Index 643.2 DataFrame基本操作 653.2.1 索引 663.2.2 排序 703.2.3 合並 733.3 其他數據類型操作 783.3.1 時間操作 783.3.2 文本操作 873.3.3 category操作 90小結 93課後習題 93第4章 pandas進階 954.1 數據的讀取與寫出 954.1.1 CSV 954.1.2 Excel 974.1.3 數據庫 984.2 DataFrame進階 1014.2.1 統計分析 1014.2.2 分組運算 1064.2.3 透視表和交叉表 1114.3 數據準備 1134.3.1 缺失值處理 1134.3.2 重復數據處理 1174.3.3 連續特徵離散化處理 1184.3.4 啞變量處理 120小結 122課後習題 122第5章 Matplotlib繪圖 1245.1 Matplotlib繪圖基礎 1245.1.1 編程風格 1245.1.2 動態rc參數 1285.2 分析特徵關系常用圖形 1335.2.1 散點圖 1335.2.2 折線圖 1355.3 分析特徵內部數據狀態常用圖形 1375.3.1 直方圖與條形圖 1385.3.2 餅圖 1405.3.3 箱線圖 142小結 144課後習題 144第6章 scikit-learn 1466.1 數據準備 1466.1.1 標準化 1466.1.2 歸一化 1496.1.3 二值化 1506.1.4 獨熱編碼 1516.2 降維 1536.2.1 PCA 1546.2.2 ICA 1586.2.3 LDA 1626.3 分類 1666.3.1 Logistic回歸 1666.3.2 SVM 1716.3.3 決策樹 1746.3.4 KNN 1786.3.5 樸素貝葉斯 1806.3.6 隨機森林 1836.3.7 多層感知機 1866.4 回歸 1896.4.1 最小二乘回歸 1916.4.2 嶺回歸 1946.4.3 Lasso回歸 1956.5 聚類 1986.5.1 K-Means 1996.5.2 層次聚類 2026.5.3 DBSCAN 2056.5.4 GMM 2086.6 模型驗證 2126.6.1 數據集劃分 2126.6.2 交叉驗證 2136.6.3 自動調參 2146.6.4 模型評價 217小結 221課後習題 221第7章 餐飲企業綜合分析與預測 2257.1 餐飲企業需求分析 2257.1.1 餐飲企業現狀與需求 2257.1.2 餐飲企業數據基本狀況 2267.1.3 餐飲企業數據分析的步驟與流程 2277.2 數據準備 2277.2.1 統計每日用餐人數與銷售額 2277.2.2 數據預處理 2297.3 使用K-Means算法進行客戶價值分析 2317.3.1 構建RFM特徵 2317.3.2 構建K-Means模型 2337.3.3 K-Means模型結果分析 2347.4 使用決策樹算法實現餐飲客戶流失預測 2367.4.1 構建客戶流失特徵 2367.4.2 構建客戶流失預測模型 2387.4.3 分析決策樹模型結果 239小結 240課後習題 240第8章 通信運營商用戶流失分析與預測 2428.1 通信運營商用戶流失需求分析 2428.1.1 通信運營商現狀與需求 2428.1.2 通信運營商數據基本情況 2428.1.3 通信運營商用戶流失分析與預測的步驟與流程 2438.2 數據準備 2448.2.1 數據去重與降維 2448.2.2 數據清洗 2458.2.3 數據合並 2478.3 特徵工程 2518.3.1 獨熱編碼 2518.3.2 合並預處理後的數據集 2528.4 使用MLP算法實現通信運營商用戶流失預測 2538.4.1 數據集劃分與數據標準化 2538.4.2 構建用戶流失預測模型 2558.4.3 模型評價 255小結 256課後習題 256


作者介紹


张良均,高级信息系统项目管理师,泰迪杯全国大学生数据挖掘竞赛(www.tipdm.org)的发起人。华南师范大学、广东工业大学兼职教授,广东省工业与应用数学学会理事。兼有大型高科技企业和高校的工作经历,主要从事大数据挖掘及其应用的策划、研发及咨询培训。全国计算机技术与软件专业技术资格(水平)考试继续教育和CDA数据分析师培训讲师。发表数据挖掘相关论文数二十余篇,已取得国家发明专利12项,主编图书《神经网络实用教程》《数据挖掘:实用案例分析》《MATLAB数据分析与挖掘实战》等9本畅销图书,主持并完成科技项目9项。获得SAS、SPSS数据挖掘认证及Hadoop开发工程师证书,具有电力、电信、银行、制造企业、电子商务和电子政务的项目经验和行业背景。




相關書籍

SPSS數據處理與分析(微課版)

作者 李良 艾旭升

2020-07-01

Spark大數據分析實戰

作者 張偉洋

2020-07-01

商業智慧與大數據分析, 4/e

作者 中華企業資源規劃學會

2020-07-01