Tableau 數據可視化從入門到精通 (視頻教學版)
內容描述
本書基於Tableau 2020版本編寫,結合編者十餘年數據分析行業從業經驗和應用心得,
詳細介紹了Tableau 2020.1的數據連接功能、圖形編輯與展示功能,包括軟件的安裝與激活、
數據類型和運算符、連接數據源、基礎操作、數據與圖形的導出、連接大數據、基礎圖表、
函數、高級數據操作、地圖分析、故事、Tableau Online、Tableau Server等內容,
還介紹了Tableau在大數據方面的應用、數據分析案例以及上機操作題。
另外,為方便讀者使用本書,本書錄製了同步全程視頻教學,提供配書資源文件和PPT教學課件。
本書適合Tableau軟件的初學者,互聯網、銀行證券、諮詢審計、快消品、能源等行業數據分析用戶以及媒體、
網站等數據可視化用戶使用,也可作為Tableau軟件培訓和高等院校相關專業的教學用書。
目錄大綱
目 錄
第1章 數據可視化及Tableau概述 1
1.1 大數據時代的挑戰 1
1.2 大數據可視化的難點 2
1.3 可視化技術的新特性 3
1.4 主要數據可視化軟件 4
1.4.1 Tableau 4
1.4.2 Microsoft Power BI 4
1.4.3 阿裡DataV 4
1.4.4 騰訊TCV 5
1.4.5 百度Sugar 5
1.4.6 FineBI 5
1.5 Tableau軟件概況 5
1.5.1 Tableau Desktop 6
1.5.2 Tableau Prep 7
1.5.3 Tableau Online 8
1.5.4 Tableau Server 8
1.5.5 Tableau Mobile 9
1.5.6 Tableau Public 9
1.5.7 Tableau Reader 10
1.6 上機操作題 10
第2章 Tableau Desktop簡介 11
2.1 主要新增功能 11
2.2 數據類型 12
2.2.1 主要的數據類型 12
2.2.2 更改數據類型 13
2.3 運算符及優先級 14
2.3.1 算術運算符 14
2.3.2 邏輯運算符 15
2.3.3 比較運算符 15
2.3.4 運算符優先級 15
2.4 軟件安裝 15
2.4.1 軟件下載 16
2.4.2 安裝步驟 16
2.4.3 軟件激活 17
2.5 軟件界面簡介 19
2.5.1 開始界面 19
2.5.2 數據源界面 20
2.5.3 工作簿界面 21
2.6 文件類型 22
2.7 上機操作題 22
第3章 連接數據源 23
3.1 連接到文件 23
3.1.1 Microsoft Excel 23
3.1.2 文本文件 25
3.1.3 JSON文件 25
3.1.4 Microsoft Access 26
3.1.5 統計文件 28
3.2 連接到數據庫 29
3.2.1 MySQL 29
3.2.2 SQL Server 30
3.2.3 Oracle 30
3.2.4 更多數據庫 31
3.3 上機操作題 32
第4章 Tableau的基礎操作 33
4.1 維度和度量 33
4.1.1 維度 33
4.1.2 度量 34
4.2 連續和離散 35
4.2.1 連續字段 36
4.2.2 離散字段 36
4.3 工作區操作 37
4.3.1 “數據”窗格 38
4.3.2 “分析”窗格 38
4.3.3 工具欄 39
4.3.4 狀態欄 40
4.3.5 卡和功能區 40
4.3.6 語言和區域設置 42
4.4 工作表操作 42
4.4.1 創建工作表 42
4.4.2 復制工作表 43
4.4.3 導出工作表 43
4.4.4 刪除工作表 43
4.5 案例:統計某商品總銷售額排名前10的客戶 44
4.6 上機操作題 47
第5章 Tableau數據導出 48
5.1 數據文件導出 48
5.1.1 復制圖形中的數據 48
5.1.2 導出數據源數據 50
5.1.3 導出交叉表數據 52
5.1.4 導出Access數據 53
5.2 導出圖形文件 54
5.2.1 通過復制導出 54
5.2.2 直接導出圖像 56
5.3 導出PDF格式文件 58
5.4 導出PowerPoint格式文件 59
5.5 發布可視化視圖 60
5.6 上機操作題 61
第6章 Tableau連接到Hadoop Hive 62
6.1 Hadoop簡介 62
6.1.1 Hadoop分佈式文件系統 62
6.1.2 MapReduce計算框架 63
6.2 連接基本條件 63
6.2.1 Hive版本 63
6.2.2 驅動程序 64
6.2.3 啟動Hive服務 64
6.3 連接主要步驟 65
6.3.1 Cloudera Hadoop 65
6.3.2 Hortonworks Hadoop Hive 65
6.3.3 MapR Hadoop Hive 66
6.4 連接註意事項 66
6.4.1 日期/時間數據 67
6.4.2 已知限制 67
6.5 檢驗測試連接 67
6.6 上機操作題 68
第7章 Tableau大數據引擎優化 69
7.1 提高連接性能 69
7.2 高級性能技術 71
7.2.1 “篩選器”形式的分區字段 71
7.2.2 分組字段形式的群集字段 71
7.2.3 初始化SQL 72
7.3 提升數據提取效率 72
7.3.1 存儲文件格式 72
7.3.2 數據分區 73
7.3.3 數據分組 73
7.4 上機操作題 73
第8章 創建圖表 74
8.1 單變量圖形 74
8.1.1 條形圖 74
8.1.2 餅圖 76
8.1.3 直方圖 78
8.1.4 折線圖 80
8.2 多變量圖形 81
8.2.1 散點圖 81
8.2.2 樹狀圖 83
8.3 上機操作題 84
第9章 Tableau函數 85
9.1 數學函數 85
9.2 字符串函數 88
9.3 日期函數 90
9.4 類型轉換函數 92
9.5 邏輯函數 93
9.6 聚合函數 95
9.7 直通函數 96
9.8 用戶函數 98
9.9 表計算函數 99
9.10 其他函數 103
9.10.1 模式匹配的特定函數 103
9.10.2 Hadoop Hive的特定函數 104
9.10.3 GoogleBigQuery的特定函數 105
9.11 上機操作題 106
第10章 Tableau的高級操作 107
10.1 表計算 107
10.2 創建字段 109
10.3 創建參數 111
10.4 聚合計算 117
10.5 缺失值處理 119
10.6 案例:超市利潤額分析 120
10.7 上機操作題 123
第11章 創建地圖 124
11.1 設置角色 124
11.2 標記地圖 125
11.3 添加字段信息 126
11.4 設置地圖選項 126
11.5 創建分佈圖 129
11.6 自定義地圖 129
11.7 上機操作題 130
第12章 故事 131
12.1 故事簡介 131
12.2 創建故事 132
12.3 設置故事格式 135
12.3.1 調整標題大小 135
12.3.2 使儀表板適合故事 136
12.3.3 設置故事格式 137
12.4 演示故事 138
12.5 上機操作題 138
第13章 Tableau Online 139
13.1 Tableau Online簡介 139
13.1.1 免費註冊試用 139
13.1.2 創建個人站點 141
13.1.3 站點頁面選項 143
13.2 Tableau Online基礎操作 148
13.2.1 設置個人賬戶 148
13.2.2 設置顯示樣式 149
13.2.3 搜索相關內容 151
13.3 Tableau Online用戶設置 152
13.3.1 設置站點角色 152
13.3.2 添加新的用戶 154
13.3.3 創建和管理群組 156
13.4 Tableau Online項目操作 159
13.4.1 創建和管理項目 159
13.4.2 創建項目工作簿 162
13.4.3 移動項目工作簿 165
13.5 上機操作題 166
第14章 Tableau Server 167
14.1 安裝系統要求 167
14.2 軟件安裝步驟 169
14.2.1 準備安裝 169
14.2.2 軟件安裝 170
14.2.3 在線激活 171
14.3 服務器配置 172
14.3.1 General(常規)配置 172
14.3.2 數據連接 173
14.3.3 Servers(服務器) 174
14.3.4 SMTP設置 174
14.3.5 Alerts and Subscriptions(通知和訂閱) 175
14.3.6 SSL 176
14.3.7 SAML 177
14.3.8 Kerberos 178
14.3.9 SAP HANA 179
14.3.10 OpenID 180
14.4 登錄服務器 180
14.5 上機操作題 181
第15章 網上超市運營分析 182
15.1 客戶分析 182
15.1.1 交易次數統計 183
15.1.2 各省市利潤 184
15.1.3 客戶散點圖 185
15.1.4 客戶交易量排名 185
15.2 配送分析 186
15.2.1 配送情況 187
15.2.2 配送準時性 187
15.2.3 商品發貨天數 188
15.2.4 配送延遲商品 189
15.3 銷售分析 189
15.3.1 銷售額統計 190
15.3.2 區域銷售額 191
15.3.3 產品細分 191
15.3.4 客戶細分 192
15.4 退貨分析 193
15.4.1 退貨區域分佈 193
15.4.2 退貨產品數量 194
15.4.3 退貨產品類型 195
15.4.4 退貨產品名稱 196
15.5 預測分析 196
15.5.1 銷售額預測 197
15.5.2 區域銷售預測 198
15.5.3 區域利潤預測 198
15.6 上機操作題 199
第16章 網站流量統計分析 200
16.1 頁面指標分析 200
16.1.1 頁面訪問次數 201
16.1.2 平均停留時間 202
16.1.3 區域熱門頁面 202
16.2 訪問量分析 203
16.2.1 訪問量地圖 203
16.2.2 各省市訪問量 205
16.2.3 訪問量趨勢 205
16.2.4 訪問量樹狀圖 206
16.3 瀏覽量分析 207
16.3.1 瀏覽量地圖 207
16.3.2 各省市瀏覽量 208
16.3.3 區域瀏覽量 209
16.3.4 瀏覽量趨勢 210
16.4 退出量分析 210
16.4.1 退出量地圖 211
16.4.2 各省市退出量 212
16.4.3 區域退出量 212
16.4.4 退出量趨勢 213
16.5 下載量分析 214
16.5.1 下載量地圖 214
16.5.2 各省市下載量 215
16.5.3 區域下載量 216
16.5.4 下載量趨勢 217
16.6 上機操作題 217
附錄A 配置ODBC數據源 219
參考文獻 221
作者介紹
王國平
畢業於上海海洋大學,碩士,主要從事數據可視化、數據挖掘和大數據分析與研究等工作。
精通Tableau、SPSS、SPSS Modeler、Power BI等軟件,已出版《IBM SPSS Modeler數據與文本挖掘實戰》
《Microsoft Power BI數據可視化與數據分析》《Tableau數據可視化從入門到精通》
《SPSS統計分析與行業應用實戰》等圖書。