人工智能數學基礎與 Python 機器學習實戰

人工智能數學基礎與 Python 機器學習實戰

作者: 劉潤森
出版社: 北京大學
出版在: 2021-01-01
ISBN-13: 9787301324820
ISBN-10: 7301324820
裝訂格式: 平裝
總頁數: 292 頁





內容描述


通常來說,人工智能(Artificial Intelligence,AI)是研究、開發用於模擬、延伸和擴展人的智能的理論、方法、技術及應用系統的一門新的技術科學。人工智能的研究領域包括機器人、語音識別、圖像識別、自然語言處理和專家系統等。 機器學習就是用算法解析數據,不斷學習,對世界中發生的事做出判斷和預測的一項技術。生活中很多機器學習的書籍只註重算法理論方法,並沒有註重算法的落地。本書是初學者非常期待的入門書,書中有很多的示例可以幫助初學者快速上手。 本書分為3個部分:第1章和第2章是人工智能的數學基礎,主要介紹了機器學習的概念、Python開發環境的搭建、機器學習bibei的數學知識,以及線性代數和概率論的相關知識;第3~12章主要介紹了回歸模型、分類模型、聚類模型、半監督模型的建立和相關算法的理論,以及如何使用sklearn具體實現相關算法模型的搭建;第13章介紹了Spark機器學習,筆者認為對於機器學習,不能只限於Python中的sklearn的學習,還要緊跟大數據時代的發展。 本書內容通俗易懂,案例豐富,實用性強,特別適合Python語言的入門讀者和進階讀者閱讀,也適合其他算法程序員和編程愛好者閱讀。


目錄大綱


第1章 走進機器學習的世界 1
1.1 機器學習概述 2
1.1.1 什麼是機器學習 2
1.1.2 機器學習的分類 2
1.1.3 常用的機器學習算法 3
1.1.4 機器學習的流程 5
1.2 Python編程語言 6
1.2.1 Python環境搭建 6
1.2.2 機器學習相關軟件包介紹 8
1.3 機器學習的數學知識 9
1.3.1 導數 9
1.3.2 基本函數的求導公式 9
1.3.3 求導法則 10
1.3.4 Python實現求導 10
1.3.5 泰勒展開式 12
1.3.6 微積分基本定理 14
1.3.7 基本函數的積分公式 14
1.3.8 Python實現積分 16
第2章 人工智能數學基礎 18
2.1 線性代數 19
2.1.1 向量及其線性運算 19
2.1.2 矩陣及其線性運算 20
2.2 隨機變量 26
2.2.1 離散型隨機變量 26
2.2.2 連續型隨機變量 27
2.3 隨機變量概率分佈 28
2.3.1 伯努利分佈 28
2.3.2 泊松分佈 29
2.3.3 指數分佈 30
2.3.4 二項分佈 31
2.3.5 正態分佈 32
2.3.6 伽馬分佈 33
2.3.7 貝塔分佈 34
2.3.8 卡方分佈 35
2.3.9 t分佈 37
2.3.10 F分佈 40
第3章 數據獲取和預處理 42
3.1 數據獲取 43
3.1.1 自帶和下載數據集 43
3.1.2 創建數據集 45
3.1.3 數據集 49
3.2 標準化 50
3.2.1 Z?score標準化 50
3.2.2 Min?Max標準化 51
3.3 二值化 52
3.3.1 特徵二值化 52
3.3.2 標籤二值化 53
3.4 特徵處理 54
3.4.1 獨熱編碼 54
3.4.2 多項式特徵 56
3.4.3 PCA降維 57
3.5 數據清洗 59
3.5.1 Pandas數據清洗 59
3.5.2 sklearn處理缺失值 62
3.6 文本特徵提取 64
3.6.1 字典提取器 64
3.6.2 詞袋模型 65
3.6.3 權重向量 67
3.7 圖像特徵提取 69
3.7.1 提取像素矩陣 69
3.7.2 提取角點 71
3.7.3 提取輪廓 74
3.7.4 提取局部特徵點 74
3.8 特徵選擇 76
3.8.1 Filter過濾法 76
3.8.2 Wrapper包裝法 78
3.8.3 Embedded嵌入法 79
第4章 線性回歸和邏輯回歸 81
4.1 線性回歸 82
4.1.1 最小二乘法 82
4.1.2 梯度下降法 84
4.1.3 線性回歸實現 86
4.1.4 Lasso回歸和嶺回歸 90
4.1.5 回歸模型評估 93
4.1.6 多項式回歸 94
4.2 邏輯回歸 96
4.2.1 邏輯回歸算法 96
4.2.2 邏輯回歸實現 98
4.2.3 分類模型評估 100
第5章 KNN和貝葉斯分類算法 107
5.1 KNN算法 108
5.1.1 KNN算法的距離度量 108
5.1.2 KNN算法代碼實現 112
5.1.3 交叉驗證 113
5.1.4 KD樹 115
5.2 貝葉斯分類算法 118
5.2.1 貝葉斯定理 118
5.2.2 高斯樸素貝葉斯 119
5.2.3 多項式樸素貝葉斯 121
5.2.4 伯努利樸素貝葉斯 123
第6章 決策樹和隨機森林 125
6.1 決策樹 126
6.1.1 熵 126
6.1.2 決策樹算法 129
6.1.3 剪枝算法 131
6.2 決策樹代碼實現 133
6.2.1 可視化決策樹 133
6.2.2 分類樹 136
6.2.3 回歸樹 143
6.3 隨機森林 144
6.3.1 集成學習算法 144
6.3.2 隨機森林分類 145
6.3.3 隨機森林回歸 148
第7章 支持向量機 150
7.1 SVM核心概念 151
7.1.1 線性可分 151
7.1.2 核函數 153
7.2 SVM代碼實現 154
7.2.1 SVC 154
7.2.2 SVM人臉識別 158
7.2.3 SVR 161
第8章 聚類算法 163
8.1 K?means聚類算法 164
8.1.1 K?means聚類算法原理 164
8.1.2 模型評估 166
8.1.3 圖像處理 167
8.1.4 K?means聚類算法實例 169
8.2 層次聚類算法 173
8.2.1 層次聚類算法原理 173
8.2.2 層次聚類算法實例 174
8.3 密度聚類算法 176
8.3.1 密度聚類算法原理 176
8.3.2 密度聚類算法實例 177
第9章 EM和HMM聚類算法 179
9.1 EM聚類算法 180
9.1.1 最大似然估計 180
9.1.2 詹森不等式 181
9.1.3 EM算法原理 182
9.2 EM算法代碼實現 183
9.3 HMM聚類算法 186
9.3.1 馬爾可夫過程 186
9.3.2 隱馬爾可夫模型 187
第10章 主題模型 190
10.1 LDA主題模型 191
10.1.1 Dirichlet分佈 191
10.1.2 LDA貝葉斯模型 192
10.2 自然語言處理常用工具包 193
10.2.1 NLTK 193
10.2.2 spaCy 196
10.2.3 Gensim 197
10.2.4 jieba 201
10.2.5 Stanford NLP 202
10.2.6 FuzzyWuzzy 203
10.2.7 HanLP 204
10.3 LDA主題模型實例 207
第11章 推薦算法 212
11.1 關聯規則 213
11.1.1 置信度 213
11.1.2 支持度 213
11.1.3 提升度 214
11.1.4 關聯規則代碼實現 214
11.2 基於用戶行為的推薦算法 217
11.2.1 矩陣分解 217
11.2.2 SVD算法代碼實現 219
11.3 基於評分的推薦算法 221
11.3.1 SlopeOne算法 221
11.3.2 SlopeOne算法代碼實現 222
11.4 協同過濾 222
第12章 數據建模 226
12.1 監督學習 227
12.1.1 監督學習回歸 227
12.1.2 監督學習分類 228
12.2 半監督學習 235
12.2.1 標籤傳播算法 235
12.2.2 半監督學習分類 236
12.3 保存模型 239
12.3.1 pickle 239
12.3.2 joblib 240
12.3.3 sklearn2pmml 240
第13章 Spark機器學習 244
13.1 Spark分佈式集群搭建 245
13.1.1 創建CentOS 7虛擬機 245
13.1.2 設置靜態IP 247
13.1.3 配置SSH服務 248
13.1.4 安裝Java 248
13.1.5 搭建三台CentOS 7主機 249
13.1.6 修改hosts文件 250
13.1.7 配置SSH免密碼登錄 251
13.1.8 搭建Hadoop集群 252
13.1.9 搭建ZooKeeper集群 255
13.1.10 啟動Hadoop和ZooKeeper集群 257
13.1.11 搭建Spark集群 260
13.2 Hadoop和Spark的基礎知識 262
13.2.1 HDFS 262
13.2.2 Spark Shell 264
13.2.3 RDD編程 268
13.2.4 Spark SQL 273
13.3 Spark MLlib 279
13.3.1 回歸模型 279
13.3.2 分類模型 281


作者介紹


劉潤森,CSDN博客專家,熟悉PyTorch、TensorFlow等深度學習框架,對計算機視覺、機器學習和深度學習有深入研究,目前擔任AI算法工程師,從事民航目標識別和檢測的工作。




相關書籍

Tableau Desktop Pocket Reference: Essential Features, Syntax, and Data Visualizations

作者 Sleeper Ryan

2021-01-01

機器視覺之 TensorFlow 2 入門原理與應用實戰

作者 李金洪

2021-01-01

Python Web 開發基礎教程 (Django版)(微課版)

作者 夏幫貴

2021-01-01