R語言(實用數據分析和可視化技術)
內容描述
<內容簡介>
《R語言(實用數據分析和可視化技術)》是資深數據專家賈里德P.蘭德數十年教學與實踐經驗的結晶,以簡單直接的方式詳細講解R語言的所有基礎知識,以及常見統計方法和模型在R中的操作規範,通過大量實例,幫助讀者快速理解並掌握R的核心功能,有效解決實際工作問題。 本書共24章,第1?3章介紹R語言的獲取與安裝、R環境的設置以及R包的基礎知識;第4?5章介紹R語言基礎知識和高級數據結構,涉及數學運算、向量、調用函數以及數據框、列表、矩陣和數組等;第6章介紹如何導入數據;第7章詳細介紹統計圖形的繪製,包括基本繪圖和ggplot2;第8?10章介紹R函數編寫,包括對結構、參數和返回規則的討論,講解if和ifelse以及複雜語句控製程序的流程、for和while循環迭代等;第11?13章介紹數據的分組操作、數據整理和字符串操作;第14?15章介紹概率分佈與描述性統計;第16?20章介紹線性模型、廣義線性模型、模型診斷、正則化與壓縮以及非線性模型等;第21章介紹時間序列和自相關;第22章介紹各種聚類方式,包括K-means和分層聚類;第23章討論可重複性、報告和利用knitr滑動展示;第24介紹如何創建R包。
<作者介紹>
(美)賈里德P.蘭德|譯者:蔣家坤 Jared P.Lander(賈里德P.蘭德) 資深數據專家,Lander Arlalytics公司創始人兼CEO,紐約開源統計編程聚會組織者,哥倫比亞大學統計學客座教授。在數據管理、多層次模型、機器學習、廣義線性模型、可視化、數據管理和統計計算等多個領域擁有豐富經驗。他致力於為各種類型的科技創業公司提供培訓、融資、金融、醫療和人道主義救援等工作。他擁有哥倫比亞大學統計學碩士學位及瑞米倫貝格大學數學學士學位。
<章節目錄>
譯者序序言前言致謝第1章 獲取R 1.1 下載R 1.2 R版本 1.3 32位與64位 1.4 安裝 1.5 R的社區版革命 1.6 小結第2章 R環境 2.1 命令行界面 2.2 Rstudio 2.3 Revolution Analytics RPE 2.4 小結第3章 R包 3.1 包的安裝 3.2 包的加載 3.3 創建一個包 3.4 小結第4章 R語言基礎 4.1 基本數學運算 4.2 變量 4.3 數據類型 4.4 向量 4.5 調用函數 4.6 函數文件 4.7 缺失數據 4.8 小結第5章 高級數據結構 5.1 數據框 5.2 列表 5.3 矩陣 5.4 數組 5.5 小結第6章 導入數據 6.1 導入CSV 6.2 導入Excel數據 6.3 讀人數據庫數據 6.4 導入其他統計工具數據 6.5 R二進制文件 6.6 包含在R中的數據 6.7 從因特網上抓取數據 6.8 小結第7章 統計圖形 7.1 基本圖形 7.2 ggplot2 7.3 小結第8章 編寫R函數
8.1 hello world! 8.2 函數參數 8.3 返回值 8.4 do.call 8.5 小結第9章 控制語句 9.1 if和else語句 9.2 switch語句 9.3 ifelse語句 9.4 複合檢查 9.5 小結第10章 循環,Un-R方式的迭代 10.1 for循環 10.2 while循環 10.3 控制循環 10.4 小結第11章 分組操作 11.1 apply函數族 11.2 aggregate 11.3 plyr 11.4 data.table 11.5 小結第12章 數據整理 12.1 cbind和rbind 12.2 連接 12.3 .reshape2 12.4 小結第13章 字符串操作 13.1 paste 13.2 把格式數據寫成串(sprintf) 13.3 提取文本 13.4 正則表達式 13.5 小結第14章 概率分佈 14.1 正態分佈 14.2 二項分佈 14.3 泊松分佈 14.4 其他分佈 14.5 小結第15章 描述性統計 15.1 概括性統計量 ]5.2 相關係數和協方差 15.3 t-檢驗 15.4 方差分析 ]5.5 小結第16章 線性模型 16.1 簡單線性回歸 16.2 多元回歸 16.3 小結第直7 章廣義線性模型
17.1 邏輯斯蒂回歸 17.2 泊松回歸 17.3 其他的廣義線性模型 17.4 生存分析 ]7.5 小結第18章 模型診斷 18.1 殘差 18.2 模型比較 18.3 交叉驗證 18.4 Bootstrap 18.5 逐步變量選擇 18.6 小結第19章 正則化和壓縮 19.1 彈性網絡 19.2 貝葉斯壓縮 ]9.3 小結第20章 非線性模型 20.1 非線性最小二乘 20.2 樣條 20.3 廣義相加模型 20.4 決策樹 20.5 隨機森林 20.6 小結第21章 時間序列和自相關 21.1 自回歸移動平均模型 21.2 向量自回歸 21.3 廣義自回歸異方差模型(GARCH) 21.4 小結第22章 聚類 22.1 K-means 22.2 PAM 22.3 分層聚類 22.4 小結第23章 可重複性、報告和利用knitr滑動展示 23.1 安裝LATEX程序 23.2 LATEX初級 23.3 通過LATEX使用knitr 23.4 Markdown技巧 23.5 使用knitr和Markdown 23.6 pandoc 23.7 小結第24章 創建R包 24.1 目錄結構 24.2 包文件 24.3 包文檔 24.4 包的檢查、創建和安裝 24.5 提交至CRAN 24.6 C++代碼 24.7 小結附錄A相關資源