R圖形化數據分析
內容描述
本書介紹如何使用圖形化的方法來分析和理解復雜的數據,該方法突出數據中重要的關聯和分佈趨勢,並使用盡可能簡單的視覺元素來呈現盡可能豐富的信息。本書重點介紹如何理解數據分析的圖形元素,以及如何使用R生成書中涉及的各種圖形。附錄中列有大量參考資料,以及章節練習解答、相關R函數、R包、故障排查等信息,便於讀者深入學習。
目錄大綱
前言ix
第一部分開始使用R
第1章R基礎2
1.1下載軟件2
1.2嘗試一些簡單的任務2
1.3用戶界面5
1.4安裝包:GUI界面6
1.5數據結構6
1.6樣本數據集7
1.7工作目錄9
1.8將數據導入R9
1.8.1命令行輸入10
1.8.2使用數據編輯器11
1.8.3從外部文件讀取13
1.9獲取腳本18
1.10用戶自定義函數20
1.11開始令人享受的事21
第2章R圖概述24
2.1圖表導出24
2.2探索性圖表和展示性圖表25
2.3 R圖形系統28
2.3.1基本圖形和網格28
2.3.2 lattice28
2.3.3 ggplot230
2.3.4包的特殊應用程序/圖表31
2.3. 5用戶自定義圖表函數31
第二部分單變量圖
第3章帶狀圖34
3.1一種簡單的圖34
3.2數據可以漂亮40
3.2.1練習3—143
3.2.2練習3—243
第4章點圖44
第5章箱線圖50
5.1箱線圖50
5.2再次訪問Nimrod54
5.3美化數據56
5.3.1練習5—159
5.3.2練習5—259
第6章莖葉圖60
第7章直方圖63
7.1簡單直方圖63
7.2帶第二個變量的直方圖66
7.2.1練習7—170
7.2.2練習7—270
第8章核密度圖71
8.1密度估計71
8.1.1選擇帶寬73
8.1.2比較兩個或多個密度圖74
8.1.3背景不是白色的76
8.2累積分佈函數76
8.2.1練習8—178
8.2.2練習8—278
第9章條形圖79
9.1基礎條形圖79
9.2脊柱圖82
9.3條形圖的間距和方向83
9.3.1練習9—186
9.3.2練習9—286
第10章餅圖87
10.1普通餅圖87
10.2扇形圖89
10.2.1練習10—190
10.2.2練習10— 290
第11章地毯圖91
第三部分雙變量圖
第12章散點圖和折線圖94
12.1基礎散點圖94
12.2折線圖99
12.3模板105
12.4增強的散點圖108
12.4.1練習12—1111
12.4.2練習12—2112
第13章高密度圖113
第14章Bland—Altman圖121
第15章QQ圖128
第四部分多變量圖
第16章散點圖矩陣和相關性分析圖136
16.1散點圖矩陣136
16.2相關性分析圖141
16.3混合定量變量和分類變量的廣義對矩陣145
第17章三維圖149
17.1三維散點圖149
17.2偽色圖154
17.3氣泡圖155
17.3.1練習17—1160
17.3.2練習17—2160
第18章協同圖161
第19章聚類分析:樹狀圖和熱圖167
19.1聚類分析167
19.2熱圖172
19.2.1練習19—1176
19.2.2練習19—2176
19.2.3練習19—3176
第20章馬賽克圖177
第五部分現在該做些什麼
第21章拓展圖形化知識和R技能的資源188
21.1 R圖188
21.2通用繪圖原則189
21.3學習更多關於R的知識189
21.4用R做統計189
附錄A參考文獻191
附錄BR的顏色193
附錄C RCommander圖形用戶界面195
附錄D使用/引用的包200
附錄E從R的外部導入數據204
附錄F章節練習解答209
附錄G故障排查:為什麼我的代碼不工作220
附錄H本書介紹的R函數228
關於作者238
關於封面238
作者介紹
作者:[美]約翰·傑伊·希爾菲傑(John Jay Hilfiger)譯者:王洋洋
【作者簡介】
John Jay Hilfiger,統計學家,數據分析專家,擁有生物統計學碩士學位,曾在康奈爾大學、羅切斯特大學和愛荷華大學擔任統計/計算機分析員。此外,Hilfiger還是一位作曲家和編曲家,擁有音樂碩士和博士學位,發表過100多首作品,曾任音樂教授。
【譯者簡介】
王洋洋
計算機碩士,狂熱的數據愛好者。現為云網絡安全領域大數據工程師,熟練多種編程語言、大數據技術、機器學習深度學習算法、設計模式等。業餘喜歡打羽毛球、練瑜伽,古箏業餘3級水平。