Microsoft Power BI數據建模與可視化快速上手
內容描述
本書由資深數據分析師精心編寫,循序漸進地介紹了Microsoft Power BI在數據建模和數據可視化中的應用。本書主要內容包括:Microsoft Power BI數據建模與數據可視化、相關分析及其視圖、回歸分析及其視圖、聚類分析及其視圖、時間序列及其視圖、決策樹及其視圖、神經網絡及其視圖、社交網絡及其視圖、文本分析及其視圖。全書以案例為主線,既包括軟件應用與操作的方法和技巧,又融入了可視化的基礎知識,使讀者通過學習本書,能夠輕鬆快速地掌握數據建模與可視化的方法與技巧。
本書可作為管理、經濟、社會人文等人員學習Microsoft Power BI軟件進行數據可視化和數據分析的參考書,也可以作為大專院校相關專業本科生、研究生的教學用書。
目錄大綱
目 錄
第1章 數據建模與數據可視化概述 1
1.1 數據建模的類型及過程 1
1.1.1 按照應用目的劃分 2
1.1.2 按照數據結構劃分 4
1.1.3 數據建模的基本過程 9
1.2 數據可視化常用軟件簡介 9
1.2.1 Microsoft Power BI 11
1.2.2 Tableau 11
1.2.3 FineBI 12
1.3 案例數據集介紹 13
1.4 練習題 15
第2章 快速認識Microsoft Power BI軟件 16
2.1 Microsoft Power BI軟件簡介 16
2.1.1 軟件的界面組成 16
2.1.2 軟件的3種視圖 18
2.1.3 軟件的下載和安裝 22
2.2 Microsoft Power BI報表編輯器 25
2.2.1 “可視化”窗格 26
2.2.2 “篩選器”窗格 28
2.2.3 “字段”窗格 28
2.3 Microsoft Power BI連接數據源 29
2.3.1 連接Excel文件 32
2.3.2 連接文本/CSV文件 33
2.3.3 連接JSON文件 36
2.3.4 連接PDF文件 38
2.3.5 連接SQL Server 40
2.3.6 連接MySQL 44
2.3.7 連接Oracle 49
2.3.8 連接Hadoop Hive 58
2.4 練習題 61
第3章 Microsoft Power BI數據建模初涉 62
3.1 創建和管理關系 62
3.1.1 創建數據表的關系 62
3.1.2 管理數據表的關系 65
3.2 數據分析表達式 66
3.2.1 DAX函數簡介及類型 66
3.2.2 省份和城市字段的合成 69
3.3 Microsoft Power BI與R的協同 71
3.3.1 安裝R 3.6.2開發環境 71
3.3.2 配置R 3.6.2開發環境 76
3.4 練習題 76
第4章 Microsoft Power BI數據可視化視圖及報表 77
4.1 基礎可視化視圖 77
4.1.1 基礎可視化視圖概述 77
4.1.2 設置可視化視圖對象 78
4.1.3 常用基礎可視化視圖 83
4.2 自定義可視化視圖 92
4.2.1 自定義可視化視圖概述 92
4.2.2 導入自定義可視化視圖 94
4.2.3 重要自定義可視化視圖 98
4.3 Microsoft Power BI數據報表 106
4.3.1 數據報表及其特點 107
4.3.2 如何製作數據報表 108
4.3.3 報表開發註意事項 114
4.4 練習題 118
第5章 相關分析及其視圖 119
5.1 相關分析概述 119
5.1.1 相關分析簡介 119
5.1.2 相關分析的應用 120
5.1.3 Pearson相關系數 121
5.1.4 Spearman相關系數 122
5.1.5 Kendall相關系數 122
5.1.6 三類相關系數的比較 123
5.2 Microsoft Power BI視圖及案例 124
5.2.1 相關分析視圖及源碼解析 124
5.2.2 企業銷售額影響因素分析 127
5.2.3 銷售額相關分析的可視化 127
5.3 練習題 128
第6章 回歸分析及其視圖 129
6.1 回歸分析概述 129
6.1.1 回歸分析簡介 129
6.1.2 回歸分析的應用 130
6.1.3 回歸分析的建模 131
6.1.4 回歸之線性回歸 132
6.1.5 回歸之邏輯回歸 134
6.1.6 回歸之嶺回歸 135
6.2 回歸分析視圖及案例—企業銷售額分析 136
6.2.1 線性回歸視圖及源碼解析 136
6.2.2 企業銷售額線性回歸預測 137
6.2.3 銷售額回歸分析的可視化 137
6.3 練習題 138
第7章 聚類分析及其視圖 139
7.1 聚類分析概述 139
7.1.1 聚類分析簡介 139
7.1.2 聚類的應用場景 142
7.1.3 聚類的建模步驟 143
7.1.4 K-Means聚類 144
7.1.5 期望最大化聚類 145
7.1.6 基於密度的聚類 147
7.2 聚類分析視圖及案例—客戶群類型分析 148
7.2.1 聚類分析視圖及源碼解析 148
7.2.2 企業客戶群類型聚類分析 152
7.2.3 客戶群聚類分析的可視化 153
7.3 練習題 154
第8章 時間序列及其視圖 155
8.1 時間序列概述 155
8.1.1 時間序列簡介 155
8.1.2 時間序列的應用 156
8.1.3 時間序列的建模 157
8.1.4 ARIMA模型 158
8.1.5 指數平滑法 160
8.1.6 TBATS模型 162
8.2 時間序列視圖及案例—商城月度訂單量分析 162
8.2.1 時間序列視圖及源碼解析 162
8.2.2 月度訂單量時間序列預測 181
8.2.3 企業月度訂單量的可視化 182
8.3 練習題 183
第9章 決策樹及其視圖 184
9.1 決策樹概述 184
9.1.1 決策樹模型簡介 184
9.1.2 決策樹模型的應用 186
9.1.3 決策樹模型的建模 187
9.1.4 決策樹之ID3算法 188
9.1.5 決策樹之C4.5算法 190
9.1.6 決策樹之CART算法 190
9.2 決策樹視圖及案例—客戶退單分析 191
9.2.1 決策樹視圖及源碼解析 191
9.2.2 企業退單影響因素分析 194
9.2.3 退單影響因素的可視化 195
9.3 練習題 197
第10章 神經網絡及其視圖 198
10.1 神經網絡概述 198
10.1.1 神經網絡簡介 198
10.1.2 神經網絡的應用 200
10.1.3 神經網絡的建模 201
10.1.4 多層感知器模型 202
10.1.5 徑向基函數模型 204
10.1.6 循環神經網絡模型 205
10.2 神經網絡視圖及案例—企業股票價格預測 206
10.2.1 神經網絡視圖及源碼解析 207
10.2.2 基於神經網絡的股價預測 207
10.2.3 股票收盤月均價的可視化 208
10.3 練習題 209
第11章 社交網絡及其視圖 210
11.1 社交網絡概述 210
11.1.1 社交網絡簡介 210
11.1.2 社交網絡的應用 211
11.1.3 社交網絡的建模 212
11.1.4 社交網絡建模軟件 213
11.1.5 社交物聯網簡介 214
11.1.6 社交網絡的弊端 215
11.2 社交網絡視圖及案例—社交圈價值分析 216
11.2.1 社交網絡視圖及源碼解析 216
11.2.2 企業社交網絡的價值分析 216
11.2.3 企業員工社交圈的可視化 217
11.3 練習題 218
第12章 文本分析及其視圖 219
12.1 文本分析概述 219
12.1.1 文本分析簡介 219
12.1.2 文本分析的步驟 221
12.1.3 文本分析的軟件 222
12.1.4 文本主題模型 224
12.1.5 文本情感分析 224
12.1.6 自然語言處理 225
12.2 文本分析視圖及案例—商品銷售狀況分析 227
12.2.1 文本分析視圖及源碼解析 227
12.2.2 如何瞭解企業商品的現狀 233
12.2.3 企業熱銷商品數據可視化 234
12.3 練習題 235
參考文獻 236