數據分析師養成寶典

數據分析師養成寶典

作者: 程顯毅
出版社: 機械工業
出版在: 2018-04-25
ISBN-13: 9787111595106
ISBN-10: 7111595106
裝訂格式: 平裝
總頁數: 311 頁





內容描述


在數據為主導的今天,對於一種已經成型的模型,“怎麽用”通常不是問題,用個軟件或者編幾行程序就能得到結果了,問題一般都出在模型“什麽時候用”和“用完了,然後呢”。《數據分析師養成寶典》就集中討論後面兩件事情。
《數據分析師養成寶典》共27章,分為業務理解篇(第1~4章)、指標設計篇(第5~7章)、數據建模篇(第8~16章)、價值展現篇(第17~19章)和實戰進階篇(第20~27章)。業務理解篇的目的是讓讀者建立正確的思維觀,理解數據,熟悉業務;指標設計篇學習把數據轉換為專家數據的一些技巧;數據建模篇以R語言為計算平臺實施數據分析全過程;價值展現篇主要討論如何撰寫有價值的數據分析報告;實戰進階篇通過對8個經典案例的分析,使讀者能夠把學到的思維方法、實施工具應用到解決實際問題中,把數據變成價值。
本書可供數據科學相關技術人員閱讀,也可作為高等院校數據科學相關專業的教材或培訓教材,以及數據分析愛好者的參考讀物。


目錄大綱


如何使用本書
第0章說在前面的話
0.1大數據分析案例
0.2數據分析
0.2.1數據分析不同於信息化系統
0.2.2數據分析不同於統計分析
0.2.3數據分析不同於數據挖掘
0.2.4數據分析不同於數據管理
0.2.5數據分析不同於商業智能
0.2.6數據分析的內容
0.3數據分析師
0.3.1什麼是數據分析師
0.3.2基本要求
0.4數據分析過程
0.4.1業務理解
0.4. 2指標設計
0.4.3數據建模
0.4.4分析報告
業務理解篇
第1章正確的思維觀
1.1數據思維
1.2統計思維
1.2.1統計學
1.2.2描述
1.2.3概括
1.2.4分析
1.3邏輯思維
1.3.1上取/下鑽思維
1.3.2求同/求異思維
1.3.3抽離/聯合思維
1.3.4離開/接近思維
1.3.5層次思維
第2章理解數據
2.1數據是什麼
2.2數據所依存的背景
2.3數據維度
2.4數據敏感
2.5數據質量
2.6理解數據要注意的問題
2.6.1不要對完美數據的盲目執著
2.6.2小樣本數據也能做數據分析
第3章理解業務
3.1全局了解——業務模型
3.2動態了解— —流程模型
3.3靜態了解——數據模型
3.4動靜結合——關鍵業務分析
3.5數據業務化
第4章理解用戶
4.1由粗到細,從宏觀到微觀
4.2由少到多,收集不同層次的需求
4.3數據分析師對理解用戶需求的思考
4.3.1如何用需求分析明確產品目標?
4.3.2數據分析師理解用戶需求應該具備的基本素養
4.3.3如何根據用戶行為去驅動產品?
指標設計篇
第5章數據準備
5.1數據探索
5.1.1缺失值分析與處理
5.1.2異常值分析與處理
5.1.3不一致數據分析
5.2數據整理
5.2.1規範化
5.2.2數據選擇
5.2.3數據歸約
5.2.4數據變換
5.3數據集成
5.3.1通過向量化重構數據
5.3.2為數據添加新變量
5.3.3數據透視表
5.3.4列聯表
5.3.5數據整合
5.3.6分組計算
第6章數據指標
6.1指標和維度
6.2特徵工程
6.2.1特徵工程作用
6.2.2特徵設計
6.2.3特徵選擇
6.2.4特徵提取
6.3指標設計基本方法
6.3.1生成用於判別的變量
6.3.2生成離散變量
6.3.3業務標籤化
6.4典型業務指標設計
6.4.1零售店鋪數據分析指標
6.4.2電商數據分析指標
第7章數據認知
7.1認知數據的平均水平和波動情況
7.2認知數據的分佈
7.3利用相關係數理解數據之間的關係
7.4通過對比認知數據
7.5通過多維交叉來深入認知數據
7.6週期性分析
7.7貢獻度分析
7.8因子分析
數據建模篇
第8章神經網絡
8.1模型原理
8.2進階指導
第9章回歸分析
9.1模型原理
9.2進階指導
第10章聚類分析
10.1模型原理
10.2進階指導
第11章關聯分析
11.1模型原理
11.2進階指導
第12章決策樹
12.1模型原理
12.2進階指導
第13章隨機森林決策樹
13.1模型原理
13.2進階指導
第14章自適應選擇決策樹
14.1模型原理
14.2進階指導
第15章SVM 
15.1模型原理
15.2進階指導
第16章建模指導
16.1建模要注意的問題
16.2R語言中建模常用包
16.3數據分析模型的原理和應用場景
價值展現篇
第17章如何寫好數據分析報告
17.1數據的價值
17.1.1收入
17.1.2支出
17.1.3風險
17.1.4參照系
17.2講故事
17.2.1數據講故事的四大要點
17.2.2阿里指數能告訴你…… 
17.3如何寫報告
17.3.1寫作原則
17.3.2報告的類型和分析能力
17.3.3報告的細節
17.4報告的結構
17.4.1標題
17.4.2背景與目標
17.4.3項目說明
17.4.4分析思路
17.4.5分析主體
17.4.6總結與建議
17.5文字表達
17.5.1突出關鍵信息
17.5.2避免囉嗦的表達
17.5.3站在讀者角度
17.5.4不帶主觀臆斷
17.6分析過程
17.6.1樣本選擇
17.6.2方法實施
17.7注意事項
第18章數據可視化
18.1什麼是數據可視化
18.2數據可視化的作用
18.3可視化建議
18.4科學與藝術的結合
18.5可視化細節
18.6R語言繪圖
18.6. 1低水平繪圖命令
18.6.2高水平繪圖命令
18.6.3交互式繪圖命令
18.7圖形適用場景
第19章數據分析報告製作工具
19.1knitr包
19.1.1安裝knitr 
19.1.2Markdown語法
19.1.3報告製作
19.2rmarkdown包
19.2.1創建R Markdown 
19.2.2R Markdown文本處理
19.2.3插入代碼塊
19.2.4結果的輸出
實戰進階篇
第20章校園網中推薦者的推薦價值分析
20.1業務理解
20.2指標設計
20.3描述性分析
20.4模型分析
20.5分析報告
第21章上市企業財務報表分析與ST預測
21.1業務理解
21.2指標設計
21.3描述性分析
21.4模型分析
21.5分析報告
第22章為什麼銷售會減少——驗證性分析
22.1業務理解
22.2指標設計
22.3描述性分析
22.4結論與建議
第23章什麼樣的顧客會選擇離開——探索性分析
23.1業務理解
23.2指標設計
23.3描述性分析
23.4結論與建議
第24章哪種廣告的效果更好——假設檢驗
24.1業務理解
24.2數據建模
24.3模型分析
24.4結論與建議
第25章如何獲得更多的用戶——多元回歸分析
25.1業務理解
25.2數據建模
25.3模型分析
25.4結論與建議
第26章航空公司顧客價值分析——聚類
26.1業務理解
26.2指標設計
26.3模型構建
26.4模型評價
26.5結論與建議
第27章竊電用戶行為分析——決策樹
27.1業務理解
27.2簡單指標設計
27.3描述性分析
27.4複雜指標設計




相關書籍

Python 3 基礎教程(第2版)(慕課版)

作者 劉凡馨 夏幫貴

2018-04-25

Statistical Hypothesis Testing with SAS and R (Hardcover)

作者 Dirk Taeger Sonja Kuhnt

2018-04-25

Python 從網路爬蟲到生活應用超實務:人工智慧世代必備的資料擷取術

作者 陳會安

2018-04-25