Python數據分析與可視化
內容描述
本書從Python數據分析的基礎知識入手,結合大量的數據分析示例,系統地介紹了數據分析與可視化方法,帶領讀者逐步掌握Python數據分析的相關知識,提高解決實際問題的能力。 本書共13章,主要內容包括數據分析與可視化概述、Python編程基礎、NumPy數值計算基礎、Pandas統計分析基礎、Pandas數據載入與預處理、Matplotlib數據可視化基礎、Seaborn可視化、pyecharts可視化、時間序列數據分析、SciPy科學計算、統計與機器學習、圖像數據分析和綜合案例實戰等。 本書可作為各類高等院校數據科學與大數據、軟件工程和電腦科學與技術等專業的教材,也可作為Python數據分析初學者和愛好者的參考書。
目錄大綱
源碼下載
目錄
第1章數據分析與可視化概述
1.1數據分析
1.2數據可視化
1.3數據分析與可視化常用工具
1.4為何選用Python進行數據分析與可視化
1.5Python數據分析與可視化常用類庫
1.6Jupyter Notebook的安裝和使用
1.6.1Jupyter Notebook的安裝
1.6.2Jupyter Notebook的使用
1.7本章小結
1.8本章習題
第2章Python編程基礎
2.1Python語言基本語法
2.1.1基礎數據類型
2.1.2變量和賦值
2.1.3運算符和表達式
2.1.4字符串
2.1.5流程控制
2.2內置數據類型
2.2.1列表
2.2.2元組
2.2.3字典
2.2.4集合
2.3函數
2.3.1函數的定義
2.3.2lambda函數
2.4文件操作
2.4.1文件處理過程
2.4.2數據的讀取方法
2.4.3讀取CSV文件
2.4.4文件寫入與關閉
2.5本章小結
2.6本章習題
2.7本章實訓
第3章NumPy數值計算基礎
3.1NumPy多維數組
3.1.1創建數組對象
3.1.2ndarray對象屬性和數據轉換
3.1.3生成隨機數
3.1.4數組變換
3.2數組的索引和切片
3.2.1一維數組的索引
3.2.2多維數組的索引
3.3數組的運算
3.3.1數組和標量間的運算
3.3.2ufunc函數
3.3.3條件邏輯運算
3.4數組讀/寫
3.4.1讀/寫二進制文件
3.4.2讀/寫文本文件
3.4.3讀取CSV文件
3.5NumPy中的數據統計與分析
3.5.1排序
3.5.2重復數據與去重
3.5.3常用統計函數
3.6本章小結
3.7本章習題
3.8本章實訓
第4章Pandas統計分析基礎
4.1Pandas中的數據結構
4.1.1Series
4.1.2DataFrame
4.1.3索引對象
4.1.4查看DataFrame的常用屬性
4.2Pandas索引操作
4.2.1重建索引
4.2.2更換索引
4.3DataFrame數據的查詢與編輯
4.3.1DataFrame數據的查詢
4.3.2DataFrame數據的編輯
4.4Pandas數據運算
4.4.1算術運算
4.4.2函數應用和映射
4.4.3排序
4.4.4匯總與統計
4.5數據分組與聚合
4.5.1數據分組
4.5.2數據聚合
4.5.3分組運算
4.6數據透視表
4.6.1透視表
4.6.2交叉表
4.7Pandas可視化
4.7.1線形圖
4.7.2柱狀圖
4.7.3直方圖和密度圖
4.7.4散點圖
4.8本章小結
4.9本章習題
4.10本章實訓
第5章Pandas數據載入與預處理
5.1數據載入
5.1.1讀/寫文本文件
5.1.2讀/寫Excel文件
5.1.3JSON數據的讀取與存儲
5.1.4讀取數據庫文件
5.2合並數據
5.2.1merge數據合並
5.2.2concat數據連接
5.2.3combine_first合並數據
5.3數據清洗
5.3.1檢測與處理缺失值
5.3.2檢測與處理重復值
5.3.3檢測與處理異常值
5.3.4數據轉換
5.4數據標準化
5.4.1離差標準化數據
5.4.2標準差標準化數據
5.5數據變換與數據離散化
5.5.1類別型數據的啞變量處理
5.5.2連續型變量的離散化
5.6本章小結
5.7本章習題
5.8本章實訓
第6章Matplotlib數據可視化基礎
6.1Matplotlib簡介
6.2Matplotlib繪圖基礎
6.2.1創建畫布與子圖
6.2.2添加畫布內容
6.2.3繪圖的保存與顯示
6.3設置Pyplot的動態rc參數
6.3.1全局參數定製
6.3.2rc參數設置
6.3.3繪圖的填充
6.3.4在繪圖中顯示公式
6.3.5文本註解
6.4Pyplot中的常用繪圖
6.4.1折線圖
6.4.2散點圖
6.4.3直方圖
6.4.4餅圖
6.4.5箱線圖
6.4.6概率圖
6.4.7雷達圖
6.4.8流向圖
6.4.9繪圖中的表格設置
6.4.10極坐標圖
6.5詞雲
6.5.1安裝相關的包
6.5.2詞雲生成過程
6.5.3詞雲生成示例
6.6本章小結
6.7本章習題
6.8本章實訓
第7章Seaborn可視化
7.1Seaborn簡介
7.2風格設置
7.2.1Seaborn繪圖設置
7.2.2Seaborn 主題設置
7.2.3設置繪圖元素比例
7.3Seaborn中的常用繪圖
7.3.1直方圖和密度曲線圖
7.3.2散點圖
7.3.3箱線圖
7.3.4散點圖矩陣
7.3.5小提琴圖
7.3.6柱狀圖
7.3.7多變量圖
7.3.8回歸圖
7.3.9關系類圖
7.3.10熱力圖
7.4本章小結
7.5本章習題
7.6本章實訓
第8章pyecharts可視化
8.1pyecharts簡介
8.2pyecharts的使用方法
8.3pyecharts常用圖表
8.3.1柱狀圖
8.3.2餅圖
8.3.3漏鬥圖
8.3.4散點圖
8.3.5K線圖
8.3.6儀表盤
8.3.7詞雲
8.3.8組合圖表
8.3.9桑基圖
8.3.10平行坐標圖
8.3.11圖
8.3.12地圖
8.4本章小結
8.5本章習題
8.6本章實訓
第9章時間序列數據分析
9.1日期和時間數據類型
9.1.1datetime構造
9.1.2數據轉換
9.2時間序列基礎
9.2.1時間序列構造
9.2.2索引與切片
9.3日期範圍、頻率和移位
9.3.1日期範圍
9.3.2頻率和移位
9.4時期
9.4.1時期基礎
9.4.2頻率轉換
9.4.3時期數據轉換
9.5重採樣、降採樣和升採樣
9.5.1重採樣
9.5.2降採樣
9.5.3升採樣
9.6時間序列的平穩性檢驗
9.6.1時序圖檢驗
9.6.2自相關圖檢驗
9.6.3構造統計量檢驗
9.7本章小結
9.8本章習題
9.9本章實訓
第10章SciPy科學計算
10.1SciPy中的常數與特殊函數
10.1.1SciPy的constants模塊
10.1.2SciPy的special模塊
10.2SciPy中的線性代數基本運算
10.2.1基本的矩陣運算
10.2.2線性方程組求解
10.2.3行列式的計算
10.2.4範數
10.2.5特徵值分解
10.2.6奇異值分解
10.3SciPy中的優化
10.3.1方程求解及求極值
10.3.2數據擬合
10.4SciPy中的稀疏矩陣處理
10.4.1稀疏矩陣的存儲
10.4.2稀疏矩陣的運算
10.5SciPy中的圖像處理
10.5.1圖像平滑
10.5.2圖像旋轉和銳化
10.6信號處理
10.6.1數據重採樣
10.6.2信號的捲積
10.6.3信號的時頻分析
10.7本章小結
10.8本章習題
10.9本章實訓
第11章統計與機器學習
11.1Scikitlearn的主要功能
11.2回歸分析
11.2.1一元線性回歸方法
11.2.2邏輯回歸
11.3分類
11.3.1決策樹規約
11.3.2KNN算法
11.3.3支持向量機
11.3.4樸素貝葉斯分類
11.4聚類
11.4.1KMeans聚類
11.4.2層次聚類
11.4.3基於密度的聚類
11.5主成分分析
11.6本章小結
11.7本章習題
11.8本章實訓
第12章圖像數據分析
12.1OpenCV簡介與導入
12.1.1OpenCV簡介
12.1.2Python中OpenCV的安裝與導入
12.2cv2圖像處理基礎
12.2.1cv2的基本方法與屬性
12.2.2cv2圖像處理示例
12.3應用尺度不變特徵變換
12.4使用加速魯棒特徵檢測
12.5圖像降噪
12.6本章小結
12.7本章習題
12.8本章實訓
第13章綜合案例
13.1職業人群體檢數據分析
13.2股票數據分析
13.3紅酒數據分析
作者介紹
魏偉一
單位:西北師範大學計算機科學與工程學院
職務:數據科學與大數據系副系主任
職稱:副教授
性別:男
年齡:44
專業:計算機科學與技術
學歷:博士研究生
研究領域:機器學習、計算機視覺
研究成果:主持或參與完成國家和省部級項目10餘項,發表論文20餘篇,sci/ei檢索10餘篇,出版教材1部。