Microsoft Power BI商業數據分析與案例實戰
內容描述
本書由資深數據分析師結合多年實際工作經驗精心編撰,結合豐富案例循序漸進地介紹Power BI在商業數據分析中的應用技巧。全書共15章,主要內容包括:商業數據分析的思維與流程,Power BI的三種視圖、視圖編輯器的窗格,連接數據源的方法,Power BI查詢編輯器、數據分析表達式DAX、創建和管理表之間的關系,Power BI自帶可視化視圖,Power BI自定義可視化視圖,如何製作Power BI數據報表,Power BI連接Cloudera Hadoop Hive、MapR Hadoop Hive集群,如何使用Spark SQL連接Apache Spark,如何通過DBeaver、Oracle SQL Developer等客戶端工具連接Hadoop集群,最後通過某企業商品結構及銷售業績、銷售經理的銷售業績、客戶價值和流失率、商品的配送準時性情況和商品的退貨情況5個案例介紹Power BI在實際業務中的操作技巧。
為了方便讀者使用本書,本書還錄制了全程教學視頻,提供了案例練習素材以及PPT教學課件。
本書可作為初學者或從業者學習Microsoft Power BI軟件進行數據可視化分析的用書,也可以作為大專院校管理、經濟、社會人文等專業的教學用書。
目錄大綱
目 錄
第一部分 •Microsoft Power BI之新手入門篇
第1章 商業數據分析及可視化概述 2
1.1 商業數據分析及其思維 2
1.2 商業數據分析基本流程 4
1.3 商業數據分析註意事項 6
1.4 商業數據可視化分析工具 7
1.4.1 Microsoft Power BI 7
1.4.2 Tableau Desktop 7
1.4.3 Smartbi Insight 8
1.4.4 Wyn Enterprise 8
1.4.5 QlikView 8
1.4.6 阿裡DataV 9
1.4.7 騰訊TCV 9
1.4.8 百度Sugar 9
1.4.9 FineBI 9
1.5 Microsoft Excel數據可視化插件 10
1.5.1 Power Pivot 10
1.5.2 Power Query 11
1.5.3 Power View 12
1.5.4 Power Map 13
1.5.5 Plotly D3.js Charts 14
1.5.6 Office Apps Fiddle 15
1.6 案例數據集介紹 16
1.6.1 某客服中心數據集 16
1.6.2 某電商企業數據集 17
1.7 練習題 19
第2章 Microsoft Power BI軟件初識 20
2.1 Microsoft Power BI軟件概況 20
2.1.1 Microsoft Power BI Desktop 20
2.1.2 Microsoft Power BI服務 22
2.1.3 Microsoft Power BI報表服務器 22
2.1.4 Microsoft Power BI數據網關 22
2.2 Microsoft Power BI的下載與安裝 23
2.2.1 安裝前的註意事項 23
2.2.2 Microsoft Power BI的下載 23
2.2.3 Microsoft Power BI的安裝 25
2.3 Microsoft Power BI軟件簡介 27
2.3.1 Microsoft Power BI主要界面 27
2.3.2 Microsoft Power BI三種視圖 29
2.3.3 Microsoft Power BI數據類型 33
2.4 Microsoft Power BI報表編輯器 34
2.4.1 Microsoft Power BI“可視化”窗格 35
2.4.2 Microsoft Power BI“篩選器”窗格 36
2.4.3 Microsoft Power BI“字段”窗格 37
2.5 練習題 37
第3章 Microsoft Power BI連接各類數據源 38
3.1 連接單個數據文件 38
3.1.1 連接Excel文件 40
3.1.2 連接文本/CSV文件 42
3.1.3 連接XML文件 44
3.1.4 連接JSON文件 45
3.1.5 連接PDF文件 48
3.1.6 連接數據文件夾 49
3.2 連接到關系型數據庫 53
3.2.1 連接Access數據庫 53
3.2.2 連接SQL Server數據庫 55
3.2.3 連接MySQL數據庫 59
3.2.4 連接PostgreSQL數據庫 64
3.2.5 連接Oracle數據庫 68
3.3 連接到非關系型數據庫 77
3.3.1 MongoDB簡介 77
3.3.2 MongoDB的安裝與配置 78
3.3.3 連接MongoDB的步驟 80
3.4 連接Web網頁數據 84
3.5 練習題 86
第4章 Microsoft Power BI基礎操作 87
4.1 數據可視化分析的基礎操作 87
4.1.1 數據屬性的操作 87
4.1.2 數據視圖的操作 92
4.2 查詢編輯器及其重要操作 95
4.2.1 查詢編輯器簡介 95
4.2.2 查詢編輯器頁面 97
4.2.3 調整數據類型 100
4.2.4 追加與合並數據 101
4.2.5 數據分類匯總 108
4.3 數據分析表達式DAX及其案例 109
4.3.1 DAX及其語法簡介 109
4.3.2 DAX函數的主要類型 110
4.3.3 省份和城市的合成 112
4.4 創建和管理表之間的關系 114
4.4.1 表與表之間的關系類型 114
4.4.2 創建表之間的數據關系 114
4.4.3 管理表之間的數據關系 117
4.5 案例:統計局Web數據可視化分析 118
4.5.1 連接到Web數據源 119
4.5.2 調整和清理源數據 120
4.5.3 創建和發布可視化視圖 127
4.6 練習題 128
第二部分 •Microsoft Power BI之可視化篇
第5章 Microsoft Power BI自帶可視化視圖 130
5.1 自帶可視化視圖概述 130
5.2 調整可視化對象元素 130
5.3 創建自帶的可視化視圖 135
5.3.1 堆積條形圖:區域銷售額的比較分析 135
5.3.2 簇狀柱形圖:客戶不同支付渠道分析 137
5.3.3 分區圖:不同類型客戶的購買額分析 138
5.3.4 堆積面積圖:不同區域的利潤額分析 139
5.3.5 折線和堆積柱形圖:月度銷售業績分析 140
5.3.6 瀑布圖:不同區域銷售額的比較分析 141
5.3.7 散點圖:銷售額和利潤額的相關分析 142
5.3.8 餅圖:不同區域銷售額的占比分析 143
5.3.9 環形圖:銷售經理的銷售業績分析 144
5.3.10 樹形圖:不同省市的利潤額分析 145
5.3.11 漏鬥圖:不同省市的銷售額分析 146
5.3.12 儀表:訂單商品的到貨時間分析 147
5.3.13 卡片圖:客戶訂單總金額的卡片圖 149
5.3.14 KPI:客戶每日客單價的走勢分析 150
5.3.15 R視覺對象:訂單金額的頻數分析 151
5.3.16 Python視覺對象:指標相關分析 153
5.4 數據可視化的註意事項 156
5.4.1 選擇合適的視覺對象 156
5.4.2 驗證與事實是否一致 156
5.4.3 圖表簡單、充實、高效、美觀 158
5.5 練習題 158
第6章 Microsoft Power BI自定義可視化視圖 159
6.1 如何自定義可視化視圖 159
6.2 下載可視化視圖模板 160
6.3 導入可視化視圖模板 162
6.4 固定可視化視圖模板 165
6.5 創建自定義可視化視圖 166
6.5.1 相關圖:訂貨量、銷售額、利潤額的相關分析 166
6.5.2 聚類圖:客戶訂單銷售額與利潤額的聚類分析 167
6.5.3 決策樹:商品到貨時間和折扣與退貨的分析 167
6.5.4 方差圖:實際到貨時間與計劃到貨時間的分析 168
6.5.5 多折線圖:不同類型商品銷售額的折線圖分析 169
6.5.6 點線圖:企業每日銷售額的走勢分析 170
6.5.7 詞雲:企業熱銷商品類型的可視化分析 171
6.5.8 博彥日歷:企業每日銷售額總和日歷圖 172
6.5.9 阿斯特圖:不同地區銷售額的占比分析 173
6.5.10 陽光圖:不同地區和商品類型的銷售額分析 174
6.5.11 和弦圖:不同區域的銷售額比較分析 175
6.5.12 雷達圖:實際到貨時間與計劃到貨時間分析 176
6.5.13 直方圖:商品訂單金額的頻數分佈情況 177
6.5.14 子彈圖:訂單商品到貨時間準時性分析 178
6.5.15 桑基圖:不同地區的支付方式比較分析 179
6.5.16 龍捲風圖:不同地區歷史銷售額的分析 180
6.6 練習題 181
第7章 Microsoft Power BI數據報表 182
7.1 Microsoft Power BI報表 182
7.1.1 Microsoft Power BI報表簡介 182
7.1.2 Microsoft Power BI報表的特點 183
7.1.3 Microsoft Power BI報表與儀表板的差異 183
7.2 創建與發布Microsoft Power BI報表 184
7.2.1 為報表添加新的視圖頁面 184
7.2.2 為報表添加“篩選器”字段 186
7.2.3 發布與共享製作好的報表 188
7.3 報表設計的註意事項 190
7.3.1 合理佈局報表視圖頁面 190
7.3.2 清楚準確地表達數據信息 192
7.3.3 報表外觀舒適美觀大方 194
7.4 練習題 194
第三部分 •Microsoft Power BI之大數據篇
第8章 連接Hadoop Hive 196
8.1 Hadoop簡介 196
8.1.1 Hadoop分佈式文件系統 197
8.1.2 MapReduce計算框架 197
8.1.3 Apache Hadoop發行版 198
8.2 連接基本條件 200
8.2.1 Hive版本:連接的必備條件 200
8.2.2 驅動程序:安裝ODBC驅動 200
8.2.3 啟動服務:運行Hive的服務 201
8.3 連接步驟:連接集群Hive 201
8.3.1 Cloudera Hadoop Hive 201
8.3.2 MapR Hadoop Hive 204
8.4 案例:不同地區銷售額的比較分析 206
8.5 練習題 208
第9章 連接Apache Spark 209
9.1 Hadoop與Spark的比較 209
9.2 連接Hadoop Spark集群 211
9.2.1 安裝Spark SQL的ODBC驅動 211
9.2.2 啟動集群和Spark相關進程 212
9.2.3 配置Spark ODBC數據源 212
9.2.4 測試Spark ODBC數據連接 213
9.3 案例:比較企業各地區的銷售業績 214
9.4 練習題 217
第10章 連接Hadoop集群工具 218
10.1 DBeaver 218
10.1.1 安裝和配置連接環境 218
10.1.2 不同職業客戶平均年齡分佈 223
10.2 Oracle SQL Developer 224
10.2.1 安裝和配置連接環境 224
10.2.2 不同教育背景客戶平均年齡分佈 227
10.3 DbVisualizer 228
10.3.1 安裝和配置連接環境 228
10.3.2 不同性別客戶平均年齡分佈 232
10.4 SQuirrel SQL Client 233
10.4.1 安裝和配置連接環境 233
10.4.2 不同類型客戶平均年齡分佈 238
10.5 練習題 239
第四部分 •Microsoft Power BI之案例實戰篇
第11章 案例實戰——銷售商品主題分析 242
11.1 準確瞭解電商商品現狀 242
11.1.1 如何瞭解商品的現狀 242
11.1.2 商品現狀可視化分析 243
11.2 如何分析商品銷售業績 246
11.2.1 正確分析商品銷售額 246
11.2.2 商品銷售額可視化分析 247
11.3 練習題 250
第12章 案例實戰——銷售經理主題分析 251
12.1 銷售經理銷售業績分析 251
12.1.1 如何考核銷售經理 251
12.1.2 銷售業績可視化分析 251
12.2 銷售經理服務滿意度分析 254
12.2.1 影響服務滿意度的因素 254
12.2.2 服務滿意度可視化分析 254
12.3 練習題 257
第13章 案例實戰——客戶價值主題分析 258
13.1 電商商品有效客戶分析 258
13.1.1 如何衡量客戶價值 258
13.1.2 有效客戶可視化分析 259
13.2 如何降低電商客戶流失率 264
13.2.1 降低客戶流失策略 264
13.2.2 客戶流失率可視化分析 265
13.3 練習題 270
第14章 案例實戰——配送準時性主題分析 271
14.1 電商商品配送準時性現狀 271
14.1.1 商品配送流程與模式 271
14.1.2 配送準時性可視化分析 271
14.2 商品配送準時性與退單關系 277
14.2.1 影響配送準時性的因素 277
14.2.2 配送準時性與退單關系分析 277
14.3 練習題 281
第15章 案例實戰——商品退貨主題分析 282
15.1 電商商品退貨現狀分析 282
15.1.1 如何規避退單的發生 282
15.1.2 商品退貨可視化分析 283
15.2 電商訂單退貨率分析 287
15.2.1 解讀電商退貨法規 287
15.2.2 商品退貨率可視化分析 287
15.3 練習題 290
附錄A 集群節點參數配置 291
A.1 Hadoop的參數配置 291
A.2 Hive的參數配置 293
A.3 Spark的參數配置 295
A.4 Zeppelin的參數配置 296
A.5 集群的啟動與關閉 297
附錄B 安裝MongoDB 299
參考文獻 303