Python數據分析從0到1
內容描述
本書以Python作為數據分析的工具,系統地介紹數據分析所需的核心知識點,為書中的數據分析任務提供分析說明、代碼示例和極為詳細的代碼註釋,對於代碼中出現的重要知識點會細心地為讀者標註出相關內容在書中出現的章節位置。
全書共11章,分為3篇:初識篇、基礎篇和進階篇。初識篇(第1和2章),主要介紹數據分析和Python的相關基礎概念,一些數據分析的具體應用場景及Python的集成開發環境;基礎篇(第3~9章),主要介紹Python的基礎語法,自動化辦公的基礎操作,數據可視化庫Matplotlib和Seaborn,數據分析的核心庫Numpy和Pandas,提供了大量翔實有趣的編程和數據分析示例;進階篇(第10和11章),主要介紹了機器學習的入門基礎理論知識和代碼實現,監督學習和無監督學習的各種典型算法,涉及機器學習和數據挖掘的常用庫scikit-learn及神經網絡框架PyTorch等的使用,還介紹了編程算法中的動態規劃,數據分析的實戰例子。
本書面向初學者,可以作為高等院校各專業的數據分析課程教材,也可以作為廣大數據分析從業者、愛好者、辦公人員、科研人員的參考和學慣用書。
目錄大綱
目錄
初識篇
第1章Python與數據分析
1.1數據分析概念
1.2為什麽使用Python
1.2.1智能時代的通用語言
1.2.2強大高效的第三方庫
1.2.3輕松的代碼結合能力
1.3數據分析領域的應用場景
1.3.1醫療健康
1.3.2交通出行
1.3.3商業策略
1.3.4經濟金融
1.3.5城鄉規劃
1.3.6氣象變化
1.3.7科研及自動化辦公
1.4本章小結
第2章初識Python
2.1Python語言特點
2.2Python安裝方式
2.2.1Anaconda安裝
2.2.2官網安裝
2.3Python集成開發環境
2.3.1Jupyter Notebook
2.3.2Spyder
2.3.3PyCharm
2.4本章小結
基礎篇
第3章Python基礎
3.1變量與賦值
3.1.1變量
3.1.2賦值
3.2輸入與輸出
3.2.1輸入
3.2.2輸出
3.3Python對象
3.3.1Python對象的概念
3.3.2變量與對象的關系
3.4數據類型
3.4.1數字
3.4.2字符串
3.4.3列表
3.4.4元組
3.4.5字典
3.4.6集合
3.5運算符與表達式
3.5.1算術運算符
3.5.2比較運算符
3.5.3邏輯運算符
3.5.4位運算符
3.5.5賦值運算符
3.5.6成員運算符
3.5.7身份運算符
3.6選擇結構
3.6.1if語句
3.6.2ifelse語句
3.6.3ifelifelse語句
3.7循環結構
3.7.1while循環
3.7.2for循環
3.7.3循環嵌套
3.7.4循環控制語句
3.8綜合示例
3.9本章小結
第4章Python函數與模塊
4.1函數
4.1.1函數的概念
4.1.2函數的聲明
4.1.3函數的參數
4.1.4函數的調用及參數值的傳遞過程
4.1.5變量的作用域
4.1.6lambda函數
4.1.7函數編程示例
4.1.8遞歸函數
4.2第三方模塊
4.2.1概念與作用
4.2.2第三方模塊的導入與使用
4.3本章小結
第5章面向對象編程
5.1面向對象
5.1.1類和對象的概念
5.1.2面向過程編程與面向對象編程比較
5.2類、對象的創建和使用
5.2.1類的定義及實例化
5.2.2類變量和類方法的權限
5.2.3綜合示例
5.3類的繼承
5.3.1繼承的概念
5.3.2繼承的語法和使用
5.4Python中的異常處理機制
5.4.1異常的概念
5.4.2異常處理語句
5.4.3assert斷言
5.4.4自定義異常
5.5本章小結
第6章Python文件操作
6.1文件字符的編碼方式
6.2Python文件的操作步驟
6.3文件的打開與關閉
6.4文件的讀取與寫入
6.5Excel文件操作庫簡介
6.6Python文件的批量自動化操作
6.7本章小結
第7章數據可視化
7.1Matplotlib
7.1.1Matplotlib簡介及安裝
7.1.2Matplotlib繪圖基礎
7.1.3默認屬性值的修改與繪圖填充
7.1.4常用繪圖形式
7.1.5詞雲
7.2Seaborn
7.2.1折線圖
7.2.2散點圖
7.2.3關聯圖
7.2.4直方圖
7.2.5其他常用繪圖形式
7.2.6繪圖風格與數據分組
7.3本章小結
第8章數值計算擴展庫
8.1NumPy簡介及安裝
8.2數組的創建
8.3數組對象ndarray的常用屬性
8.4數組對象的數據取值
8.4.1索引取值
8.4.2索引列表取值
8.4.3切片取值
8.4.4布爾取值
8.4.5搭配取值
8.4.6迭代取值
8.5數組對象元素的更新
8.6數組對象的合並與拆分
8.7數組對象的基本運算與廣播機制
8.8數組對象支持的數據類型
8.9數組對象的維度轉換
8.10NumPy的隨機數組
8.11數組對象的常用數據統計函數
8.12數據處理常用操作
8.13數組對象的常用數學函數
8.14NumPy與線性代數計算
8.15NumPy文件和批量數據操作
8.16本章小結
第9章結構化數據分析庫
9.1Pandas簡介及安裝
9.2Pandas支持的數據類型
9.3Series對象詳細講解
9.3.1Series對象的創建方法
9.3.2Series對象的屬性
9.3.3Series對象的取值
9.3.4Series對象的更新
9.3.5Series對象的基本運算
9.3.6Series對象的統計函數
9.3.7Series對象的字符串處理
9.3.8Series對象的常用函數
9.4DataFrame對象詳細講解
9.4.1DataFrame對象的創建方法
9.4.2DataFrame對象的屬性
9.4.3DataFrame對象的取值
9.4.4DataFrame對象的更新
9.4.5DataFrame對象的基本運算
9.4.6DataFrame對象的統計函數
9.4.7DataFrame對象的字符串處理
9.4.8DataFrame對象的常用函數
9.5Pandas的文件操作
9.5.1讀取和寫入Excel文件
9.5.2批量處理多個Excel文件數據
9.5.3讀取和寫入csv文件
9.5.4讀取和寫入txt文件
9.6Pandas的數據分組與聚合
9.6.1數據分組
9.6.2數據聚合
9.6.3綜合示例
9.7Pandas的透視表與交叉表
9.7.1透視表
9.7.2交叉表
9.8Pandas的數據預處理
9.8.1缺失值處理
9.8.2重復值處理
9.8.3歸一化處理
9.8.4有效性審校
9.8.5連續值離散化
9.8.6離散值編碼
9.9Pandas的時間序列處理
9.9.1創建時間序列
9.9.2時間序列格式化
9.9.3時間序列運算
9.9.4時間序列屬性
9.9.5時間序列處理綜合示例
9.10Pandas數據的可視化
9.11本章小結
進階篇
第10章數據分析常用算法
10.1機器學習基礎
10.2監督學習算法
10.2.1線性回歸
10.2.2邏輯回歸
10.2.3KNN算法
10.2.4基於PyTorch搭建神經網絡
10.2.5線性判別分析
10.2.6樸素貝葉斯分類器
10.2.7SVM支持向量機
10.2.8決策樹
10.3無監督學習算法
10.3.1聚類
10.3.2PCA數據降維
10.4編程算法在數據分析中的應用
10.4.1編程算法與數據分析
10.4.2動態規劃算法概念
10.4.3動態規劃算法編程示例
10.4.4動態規劃算法在數據分析中的應用示例
10.5本章小結
第11章數據分析實戰
11.1數據集介紹
11.2實戰演練
11.2.1數據預處理
11.2.2統計分析與繪圖
11.2.3機器學習建模
11.3本章小結
參考文獻