Python 數據分析基礎 (包含數據挖掘和機器學習)

Python 數據分析基礎 (包含數據挖掘和機器學習)

作者: 阮敬
出版社: 五南
出版在: 2019-07-12
ISBN-13: 9789577634467
ISBN-10: 957763446X
總頁數: 592 頁





內容描述


從統計學出發,最實用的Python工具書。
◆全書基於Python3.6.4編寫,兼容性高,為業界普遍使用之版本。
◆以簡明文字闡述替代複雜公式推導,力求降低學習門檻。
◆簡單易懂,理論完整,案例詳盡。
◆包含AI領域熱門的深度學習、神經網路及統計思維的數據分析,洞察市場先機。

Python,是當今大數據時代下最為流行的編程工具之一;資料分析,則是在科學研究中日益重視的環節。當開源語言的便利性,遇上統計思維的重要性,本書便應運而生。

本書從基礎統計學出發,是初學者的Python實用書籍。從統計學的視角和需求來寫Python的應用,有很多運用Stats Model和SciPy來進行統計分析的案例,對於具統計背景的人學習Python很有幫助!

針對當前人工智慧領域較為熱門的「深度學習」亦有所涉獵。介紹神經網路與深度學習的基本思想、架構及步驟,並利用TensorFlow架構工具解決實際案例。是一本適合對Python和統計學有興趣的讀者、相關研究者以及企業決策者的工具書。


目錄大綱


第1 版前言
第2 版前言

Chapter01 Python 程式設計基礎
1.1 Python 系統組態
1.2 Python 基礎知識
1.2.1 幫助
1.2.2 識別字
1.2.3 行與縮進
1.2.4 變數與物件
1.2.5 數字與運算式
1.2.6 運算子
1.2.7 字串
1.2.8 日期和時間
1.3 資料結構與序列
1.3.1 列表
1.3.2 元組
1.3.3 字典
1.3.4 集合
1.3.5 推導式
1.4 語句與控制流
1.4.1 條件陳述式
1.4.2 迴圈語句
1.5 函數
1.5.1 函數的參數
1.5.2 全域變數與區域變數
1.5.3 匿名函數
1.5.4 遞迴和閉包
1.5.5 柯里化與反柯里化
1.5.6 常用的內建高階函數
1.6 反覆運算器、生成器和裝飾器
1.6.1 反覆運算器
1.6.2 生成器
1.6.3 裝飾器

Chapter02 Python 程式設計進階
2.1 類
2.1.1 聲明類
2.1.2 方法
2.1.3 屬性
2.1.4 繼承
2.1.5 特性
2.2 異常捕獲與容錯處理
2.2.1 錯誤和異常
2.2.2 異常處理
2.3 模組
2.4 軟體套件
2.4.1 軟體套件的組成與使用
2.4.2 常用資料分析工具庫
2.5 文件I/O
2.6 多核心平行計算
2.6.1 多進程
2.6.2 並行

Chapter03 數據預處理
3.1 numpy 基礎
3.1.1 向量
3.1.2 陣列
3.1.3 矩陣
3.1.4 文件讀寫
3.2 pandas 基礎
3.2.1 pandas 的資料結構
3.2.2 pandas 的資料操作

Chapter04 資料描述
4.1 統計量
4.1.1 集中趨勢
4.1.2 離散程度
4.1.3 分布形狀
4.2 統計表
4.2.1 統計表的基本要素
4.2.2 統計表的編製

Chapter05 統計圖形與視覺化
5.1 matplotlib 基本繪圖
5.1.1 函數繪圖
5.1.2 圖形基本設置
5.1.3 物件導向繪圖
5.1.4 繪圖樣式
5.2 pandas 基本繪圖
5.3 基本統計圖形
5.3.1 折線圖
5.3.2 面積圖
5.3.3 長條圖
5.3.4 橫條圖
5.3.5 龍捲風圖
5.3.6 圓形圖
5.3.7 階梯圖
5.3.8 箱形圖
5.3.9 小提琴圖
5.3.10 散點圖
5.3.11 氣泡圖
5.3.12 六邊形箱形圖
5.3.13 雷達座標圖
5.3.14 輪廓圖
5.3.15 調和曲線圖
5.3.16 等高線圖
5.3.17 極座標圖
5.3.18 文字雲
5.3.19 資料地圖
5.4 其他繪圖工具

Chapter06 簡單統計推斷
6.1 簡單統計推斷的基本原理
6.1.1 資料分布
6.1.2 參數估計
6.1.3 假設檢驗
6.2 單總體參數的估計及假設檢驗
6.2.1 單總體的參數估計
6.2.2 單總體參數的假設檢驗
6.3 兩總體參數的假設檢驗
6.3.1 獨立樣本的假設檢驗
6.3.2 成對樣本的假設檢驗

Chapter07 方差分析
7.1 方差分析的基本原理
7.2 一元方差分析
7.2.1 一元單因素方差分析
7.2.2 一元多因素方差分析
7.3 協方差分析

Chapter08 非參數檢驗
8.1 非參數檢驗的基本問題
8.2 單樣本非參數檢驗
8.2.1 中位數(平均值)的檢驗
8.2.2 分布的檢驗
8.2.3 連串檢定
8.3 兩個樣本的非參數檢驗
8.3.1 獨立樣本中位數比較的Wilcoxon 秩和檢驗
8.3.2 獨立樣本的分布檢驗
8.3.3 成對(匹配)樣本中位數的檢驗
8.3.4 兩樣本的連串檢定
8.4 多個樣本的非參數檢驗
8.4.1 多個樣本的分布檢驗
8.4.2 獨立樣本位置的檢驗

Chapter09 相關分析與關聯分析
9.1 相關分析
9.1.1 函數關係與相關關係
9.1.2 簡單相關分析
9.1.3 偏相關分析
9.1.4 點二列相關分析
9.1.5 非參數相關分析
9.2 關聯分析
9.2.1 基本概念與資料預處理
9.2.2 Apriori 演算法
9.2.3 FP-growth 演算法

Chapter10 迴歸分析
10.1 線性迴歸
10.1.1 迴歸分析的基本原理
10.1.2 一元線性迴歸
10.1.3 多元線性迴歸
10.1.4 含有定性引數的線性迴歸
10.2 非線性迴歸
10.2.1 可線性化的非線性分析
10.2.2 非線性迴歸模型
10.3 多項式迴歸
10.4 分位數迴歸

Chapter11 離散因變數模型
11.1 線性機率模型
11.2 二元選擇模型
11.2.1 線性機率模型的缺陷與改進
11.2.2 二元選擇模型的基本原理
11.2.3 BINARY PROBIT 模型
11.2.4 BINARY LOGIT 模型
11.3 多重選擇模型
11.4 計數模型

Chapter12 主成分與因素分析
12.1 數據降維
12.1.1 資料降維的基本問題
12.1.2 數據降維的基本原理
12.2 主成分分析
12.2.1 主成分分析的基本概念與原理
12.2.2 主成分分析的基本步驟和過程
12.3 因素分析
12.3.1 因素分析的基本原理
12.3.2 因素分析的基本步驟和過程

Chapter13 列聯分析與對應分析
13.1 列聯分析
13.1.1 列聯表
13.1.2 列聯表的分布
13.1.3 χ2 分布與χ2 檢驗
13.1.4 χ2 分布的期望值準則
13.2 對應分析
13.2.1 對應分析的基本思想
13.2.2 對應分析的步驟和過程

Chapter14 聚類
14.1 聚類的基本原理
14.1.1 聚類的基本原則
14.1.2 單一指標的系統聚類過程
14.1.3 多指標的系統聚類過程
14.2 聚類的步驟和過程
14.2.1 系統聚類
14.2.2 K-MEANS 聚類
14.2.3 DBSCAN 聚類

Chapter15 判別和分類
15.1 判別和分類的基本思想
15.1.1 判別
15.1.2 分類
15.1.3 效果評估
15.2 常用判別方法和分類演算法
15.2.1 距離判別和線性判別
15.2.2 貝葉斯判別
15.2.3 k- 近鄰
15.2.4 決策樹
15.2.5 隨機森林
15.2.6 支持向量機

Chapter16 神經網路與深度學習
16.1 神經網路
16.1.1 基本概念與原理
16.1.2 感知機
16.1.3 多層神經網路
16.2 深度學習
16.2.1 基本概念與原理
16.2.2 卷積神經網路
16.2.3 Tensorflow

Chapter17 時間序列分析
17.1 時間序列的基本問題
17.1.1 時間序列的組成部分
17.1.2 時間序列的平穩性
17.2 ARIMA 模型的分析過程
17.2.1 ARIMA 模型
17.2.2 ARMA 模型的識別、估計與預測

附錄:各章圖形


作者介紹


阮敬(1979.10),博士,教授,博士生導師。現任首都經濟貿易大學研究生院副院長,北京市豐台區政協委員。兼任中國消費者協會專家委員會委員、中國青年統計學家協會創始秘書長、中國現場統計研究會副秘書長兼經濟與金融統計分會副理事長、中國統計教育學會常務理事兼高等教育分會秘書長、中國商業統計學會常務理事兼數據科學與商業智慧分會學術委員會副主任、全國工業統計學教學研究會常務理事、北京大數據協會副秘書長等職。

近年來主持國家社科基金、教育部人文社科基金、北京市自然科學基金、北京市社科基金、留學人員擇優資助基金等科研項目和世界500強企業及大型國企、國家部委及北京市政府部門等橫向課題共50餘項。

在國內外公開發表論文50餘篇,出版專著、譯著和教材12部,先後14次榮獲國務院學位委員會全國應用統計專業學位研究生教育指導委員會優秀教育教學成果獎、全國統計科學研究優秀成果獎、北京市哲學社會科學優秀成果獎、北京市統計科學研究優秀成果獎、北京市優秀調查研究成果獎等科研和教學獎勵。本書曾入選「十三五全國統計規劃教材」。




相關書籍

Practical Data Analysis using Jupyter Notebook

作者 Marc Wintjen Andrew Vlahutin

2019-07-12

Understanding LTE with MATLAB: From Mathematical Modeling to Simulation and Prototyping (Hardcover)

作者 Houman Zarrinkoub

2019-07-12

深度學習進階:卷積神經網絡和對象檢測

作者 Umberto Michelucci 陶陽 李亞楠譯譯

2019-07-12