Python數據分析與應用
內容描述
本書基於作者多年來的課程教學經驗和利用Python進行數據分析的工程經驗編寫而成,
面向數據分析的初學者,使其具備利用Python開展數據分析工作、解決各專業問題的思維和能力。
高校計算機、大數據、人工智能及其他相關專業均可使用本書作為數據分析課程教材。
目錄大綱
第1章 基礎知識
1.1 數據分析簡介
1.2 Python編程基礎
1.2.1 Anaconda環境的安裝配置
1.2.2 Jupyter Notebook的使用
1.2.3 內置數據類型
1.2.4 程序控制結構
1.2.5 模塊化
1.2.6 面向對象
1.2.7 文件操作
1.2.8 異常處理
1.3 包/模塊使用示例
1.3.1 CSV文件操作
1.3.2 排序時間測試
1.4 本章小結
第2章 科學計算基礎工具包NumPy
2.1 ndarray類
2.1.1 為什麼使用ndarray
2.1.2 ndarray類對象常用屬性
2.1.3 創建ndarray類對象
2.2 本章示例數據
2.3 索引和切片基礎
2.4 數據拷貝
2.5 數據處理
2.5.1 基礎運算
2.5.2 廣播機制
2.5.3 通用函數
2.5.4 常用函數和方法
2.6 高級索引
2.7 本章小結
第3章 數據分析工具庫Pandas
3.1 Series類
3.1.1 Series對象常用屬性
3.1.2 創建Series對象
3.2 DataFrame類
3.2.1 DataFrame對象常用屬性
3.2.2 創建DataFrame對象
3.3 Index類
3.3.1 Index對象常用屬性
3.3.2 創建Index對象
3.4 元素訪問方式
3.4.1 屬性運算符訪問
3.4.2 索引運算符訪問
3.4.3 loc訪問方法
3.4.4 iloc訪問方法
3.4.5 at和iat索引方法
3.4.6 head和tail方法
3.5 數據清洗
3.5.1 處理缺失數據
3.5.2 刪除重複數據
3.6 數據合併
3.6.1 merge方法
3.6.2 join方法
3.6.3 concat方法
3.7 數據重塑
3.7.1 pivot方法
3.7.2 melt方法
3.8 Pandas數據處理實例
3.8.1 藥品銷售數據處理實例
3.8.2 流感與人口數據處理實例
3.9 本章小結
第4章 數據統計分析
4.1 基本統計分析
4.2 分組分析
4.2.1 定性分組
4.2.2 定量分組
4.3 分佈分析
4.4 交叉分析
4.5 結構分析
4.6 相關分析
4.7 應用實例
4.8 本章小結
第5章 時間序列分析
5.1 Datetime 模塊
5.2 時間序列基礎
5.3 日期時間處理
5.4 頻率轉換與重採樣
5.4.1 頻率轉換
5.4.2 重採樣
5.5 本章小結
第6章 數據可視化
6.1 Matplotlib
6.1.1 線形圖
6.1.2 條形圖
6.1.3 餅圖
6.1.4 散點圖
6.1.5 直方圖
6.2 Seaborn
6.2.1 關係圖
6.2.2 分佈圖
6.2.3 分類圖
6.2.4 回歸圖
6.2.5 熱力圖
6.3 Pyecharts
6.3.1 Pyecharts圖表類
6.3.2 Pyecharts圖表配置
6.4 應用實例
6.5 本章小結
第7章 常見數據格式和網絡爬蟲
7.1 網絡數據獲取
7.1.1 Request模塊簡介
7.1.2 Requests模塊主要方法及功能一覽
7.1.3 例程代碼清單
7.2 數據文件操作
7.2.1 BeautifulSoup4模塊簡介
7.2.2 BeautifulSoup4模塊常用方法及功能一覽
7.2.3 例程代碼清單
7.3 應用實例
7.4 本章小結
第8章 MySQL數據庫操作
8.1 MySQL簡介
8.2 MySQL安裝
8.3 連接、讀取和存儲
8.3.1 創建數據庫和數據表
8.3.2 Python連接數據庫
8.3.3 Python讀取數據庫
8.3.4 Python存儲數據庫
8.4 數據操作
8.4.1 查詢操作
8.4.2 插入操作
8.4.3 更新操作
8.4.4 刪除操作
8.5 應用實例
8.6 本章小結