R語言:從數據思維到數據實戰
內容描述
如何從數據中挖掘價值?一是要鍛煉數據思維;二是需要選擇一個便利快捷的工具。R語言在數據分析方面有著靈活、高效的優勢。本書以R語言為基礎,深度講解從數據思維到實戰的全過程。在章節組織上,本從R語言簡介及優勢入手,再到數據讀取、清洗、描述、建模等數據分析的各個環節,由淺入深逐個講解,是一本實務分析中的“R語言指南”。同時,本書採用大量實際案例輔以說明,既有助於上手分析,也可用於教學使用。
本書所有代碼、數據可在狗熊會官網(http://www.xiong99.com.cn/create.php)免費下載。同時,關註狗熊會微信公眾號,可獲取更多擴展資源。
目錄大綱
目錄
第1章初識R語言
1.1初識R語言
1.2安裝R語言
1.3獲取R幫助文檔
第2章R語言數據操作
2.1R中的數據類型
2.2數據讀入
第3章R語言與統計分析
3.1描述分析及可視化
3.2統計檢驗
3.3回歸分析
3.4代碼規範與文檔撰寫
第4章R語言與非結構化數據分析
4.1文本分析
4.2圖像分析
第5章R語言與機器學習
5.1機器學習概述
5.2數據預處理
5.3模型訓練與調參
5.4模型訓練與集成
第6章R語言爬蟲初介
6.1HTML基礎與R語言解析
6.2XML與XPath表達式以及R爬蟲應用
6.3HTTP協議
6.4AJAX與網頁動態加載
6.5正則表達式與字符串處理函數
6.6R語言爬蟲實戰
作者介紹
朱雪寧復旦大學大數據學院助理教授。博士畢業於北京大學光華管理學院商務統計系,後於賓州州立大學(Pennsylvania State University)從事博士後研究工作。狗熊會創始團隊成員、《R語千尋》專欄負責人;統計之都核心成員、編輯部主編。研究上關注社交網絡數據分析、高維數據分析等問題。