交互的Python 數據分析入門

交互的Python 數據分析入門

作者: 王詩翔
出版社: 人民郵電
出版在: 2020-07-01
ISBN-13: 9787115535702
ISBN-10: 7115535701
裝訂格式: 平裝
總頁數: 324 頁





內容描述


Python具有強大的應用能力,以及便捷高效的數據分析和可視化擴展包系統。
本書重點講解Python數據分析的基礎知識,使讀者通過Python理解數據分析的邏輯,
並掌握基本的Python編程知識和分析實現方法。
本書系統全面、循序漸進地介紹了Python編程基礎、數據導入、數據分析和可視化內容,
包括條件判斷與循環控制、從Excel中導入數據、使用Pandas庫進行數據的轉換和計算,
以及使用Plotnine庫繪製ggplot風格的圖形等。
此外,本書還涉及Markdown、基本的統計理論和IPython魔術命令等內容。


目錄大綱


目錄:
第1章Python介紹及學習前的準備1
1.1 Python是什麼1
1.2為什麼要使用Python進行數據分析2
1.3科學計算核心庫簡介2
1.4搭建環境3
1.4.1線上平台3
1.4.2本地機器環境下相關軟件的安裝4
1.5章末小結12
第2章Python入門示例及基礎知識13
2.1 Python解釋器與IPython 13
2.1.1標準Python解釋器13
2.1.2 IPython 14
2.2 Python入門示例15
2.3 nteract軟件使用簡介16
2.4算術運算17
2.4.1簡單數學運算17
2.4.2代碼約定18
2.4.3計算身體質量指數19
2.5變量簡介20
2.5.1什麼是變量20
2.5.2變量的命名21
2.6基本數據類型22
2.6.1數字22
2.6.2字符串23
2.6.3布爾值24
2.6.4查看數據類型24
2.7數據運算25
2.7.1加號與黑箱子25
2.7.2類型轉換26
2.7 .3運算符匯總26
2.8章末小結27
第3章基本數據結構28
3.1列表28
3.1.1列表的創建28
3.1.2修改列表元素30
3.1.3遍歷列表30
3.1.4列表操作符31
3.1.5列表切片32
3.1.6列表方法、函數與操作33
3.1.7列表與字符串37
3.1.8列表對象與值38
3.2元組39
3.2.1元組的創建40
3.2.2元組操作40
3.2.3元組與列表的區別42
3.3字典42
3.3.1字典的創建與使用42
3.3.2字典操作43
3.4集合45
3.4.1集合的創建45
3.4.2集合操作45
3.4.3冰凍集46
3.5章末小結47
第4章控制流與文件操作48
4.1條件結構if-else 48
4.1 .1簡單if-else結構49
4.1.2嵌套條件結構50
4.1.3單行if-else 51
4.1.4使用邏輯操作符51
4.2 for語句52
4.2.1 for語句塊53
4.2.2 else語句塊53
4.2.3索引迭代54
4.2.4多列表迭代55
4.2.5列表推導式55
4.2.6條件列表推導式57
4.2.7字典迭代58
4.3 while語句59
4.4 continue、break與pass 61
4.4.1 continue 61
4.4.2 break 62
4.4.3 pass 64
4.5文件操作64
4.5.1文件類型65
4.5.2使用open()函數讀取文件65
4.5.3使用open()寫文件68
4.6章末小結68
第5章函數與模塊69
5.1函數69
5.1.1為什麼使用函數69
5.1.2函數的調用70
5.1.3函數的創建71
5.1.4函數作用域72
5.1 .5遞歸函數73
5.2函數的參數76
5.2.1位置參數76
5.2.2關鍵字參數77
5.2.3可變參數79
5.3模塊80
5.3.1模塊與包結構80
5.3.2模塊的創建81
5.3.3模塊的作用域83
5.3.4三方模塊的安裝83
5.3.5模塊的使用85
5.4章末小結87
第6章NumPy 88
6.1 NumPy簡介與ndarray 88
6.1.1 NumPy簡介88
6.1.2創建ndarray 89
6.2數組操作92
6.2.1數組運算92
6.2.2索引與切片95
6.2.3布爾型索引99
6.2.4數組轉置與軸轉換101
6.3數組函數與方法103
6.3.1通用函數103
6.3.2基本統計105
6.3.3排序與集合操作107
6.3.4線性代數操作108
6.3.5偽隨機數的生成109
6.3.6數組文件的輸入與導出111
6.4章末小結112
第7章Matplotlib 113
7.1 Matplotlib入門113
7.1.1 Matplotlib庫簡介113
7.1.2命名約定114
7.1.3如何展示圖形114
7.1.4保存圖形116
7.1.5兩種繪圖接口117
7.2基本圖形繪製119
7.2.1線圖119
7.2 .2散點圖132
7.2.3條形圖137
7.2.4直方圖142
7.2.5餅圖146
7.2.6箱線圖148
7.3多圖與自定義150
7.3.1多圖150
7.3.2設置風格154
7.3.3兩種接口映射156
7.4章末小結157
第8章Pandas入門158
8.1 Pandas簡介158
8.2 Pandas的數據結構159
8.2.1 Series 159
8.2.2 DataFrame 161
8.3 Pandas對象基本操作163
8.3.1查看數據164
8.3.2轉置165
8.3.3重索引165
8.3.4刪除數據168
8.3.5重賦值169
8.3.6索引與過濾169
8.3.7算術運算174
8.3.8函數應用176
8.3.9排序177
8.4基本統計分析179
8.5章末小結180
第9章Markdown基礎181
9.1 Markdown簡介181
9.2 Markdown語法182
9.2.1塊元素182
9.2.2內聯元素188
9.3聯合Python與Markdown 191
9.3.1代碼塊與文本塊191
9.3.2文檔範例192
9.4章末小結195
第10章數據導入196
10.1 CSV文件196
10.1.1使用字符串方法197
10.1.2使用csv標準模塊197
10.1.3使用Pandas庫198
10.2 CSV變體198
10.2.1創建CSV導入函數199
10.2.2使用Pandas導入200
10.2.3導出CSV 202
10.3 Excel文件203
10.3.1檢查數據203
10.3.2準備工作204
10.3.3使用Pandas讀寫Excel 205
10.4 pickle文件207
10.5 SAS與Stata文件208
10.6 HDF5文件209
10.7 MATLAB文件210
10.8 json文件211
10.9 YAML文件213
10.10網頁數據215
10.11數據庫數據218
10.12章末小結220
第11章數據分析工具箱221
11.1輔助函數與工具221
11.1.1序列解包221
11.1.2斷言222
11.1.3常用的字符串方法223
11.2作用域與求值計算223
11.2.1作用域223
11.2.2使用exec()和eval()執行計算224
11.3異常的捕獲和處理225
11.3.1捕獲異常225
11.3.2產生異常227
11.4函數式編程227
11.4.1高階函數227
11.4.2常用的高階函數228
11.4.3 itertools模塊229
11.5生成器與裝飾器230
11.5.1生成器230
11.5.2利用生成器讀入大型數據集232
11.5.3裝飾器232
11.6正則表達式233
11.7章末小結236
第12章Pandas進階237
12.1深入Pandas數據結構237
12.1.1回顧237
12.1.2分類變量239
12.1.3時間序列243
12.2迭代與函數應用247
12.2.1迭代247
12.2.2函數應用250
12.2.3字符串函數253
12.2.4分組計算256
12.3數據清洗256
12.3.1缺失值處理257
12.3.2連接259
12.3.3級聯262
12.4 Pandas可視化265
12.4.1條形圖266
12.4.2直方圖268
12.4.3箱線圖269
12.4.4面積圖270
12.4.5散點圖271
12.4.6餅圖271
12.5章末小結272
第13章數據可視化進階273
13.1 Seaborn 273
13.1. 1成對圖274
13.1.2子集圖279
13.1.3回歸圖280
13.1.4核密度圖281
13.1.5條形圖282
13.1.6計數圖284
13.1.7點圖284
13.1.8箱線圖285
13.1.9小提琴圖286
13.1.10雙變量分佈圖286
13.2 Plotnine 288
13.2.1 ggplot術語290
13.2.2 ggplot初探290
13.2.3常見的幾何函數和選項298
13.3 Bokeh 299
13.3.1 Bokeh基礎299
13.3 .2圖形排列303
13.4章末小結305
第14章統計分析306
14.1概括性度量306
14.1.1集中趨勢的度量307
14.1.2離散程度的度量308
14.1.3偏態與峰態的度量309
14.2統計分佈311
14.2.1正態分佈311
14.2 .2二項分佈312
14.2.3伯努利分佈314
14.2.4指數分佈314
14.2.5泊松分佈315
14.3假設檢驗316
14.3.1 u與t統計量316
14.3.2一個t檢驗實例317
14.3. 3兩樣本t檢驗317
14.4章末小結318
第15章未言及的內容319
15.1魔術命令319
15.2面向對象編程321
15.3章末小結323
結語:接下來學什麼324


作者介紹


王詩翔

本科畢業於電子科技大學,獲工學學士學位,*秀畢業論文獲得者。
目前在上海科技大學深造,攻讀博士學位。
主要工作是利用公開發表的數據集和數據庫研究和分析癌症基因組學數據,
挖掘有臨床應用價值的生物標誌物。




相關書籍

Python機器學習

作者 [新加坡] 李偉夢(Wei-Meng Lee) 李周芳 譯

2020-07-01

Inverse Synthetic Aperture Radar Imaging With MATLAB Algorithms (Hardcover)

作者 Caner Ozdemir

2020-07-01

一行指令學 Python-用 Pandas 掌握商務大數據分析 (附範例光碟)

作者 徐聖訓

2020-07-01