Tableau 數據可視化從入門到精通
內容描述
本書由專業的數據分師根據新版Tbaleau 10精心編撰,全書以Tableau桌面軟件Desktop為主線,詳盡介紹了Tableau的基本概念、術語及數據分析與可視化的各種功能和知識。
介紹了連接多種數據源,包括Excel、文本文件、Access、JSON文件、統計文件及SQL Server、MySQL、Oracle等數據庫,同時介紹了連接大數據平臺Hadoop Hive以及大數據引擎的優化。
介紹瞭如何在Tableau中創建圖表、使用函數、創建地圖、創建故事表,並配合案例進行分析。
介紹了Tableau Online和Tableau Server的使用和操作技巧。
通過網上超市運營分析和網站流量統計分析兩個商業案例深入介紹了Tableau的應用技巧,幫助讀者盡快將Tableau的強大功能應用於工作實踐。
目錄大綱
第1章數據可視化及Tableau概述1
1.1大數據時代的挑戰2
1.2大數據可視化的難點2
1.3可視化技術的新特性3
1.4主要的數據可視化軟件4
1.4.1 Tableau 4
1.4.2 QlikView 4
1.4. 3 ECharts 5
1.4.4 HighCharts 5
1.5 Tableau軟件概況5
1.5.1 Tableau Desktop 6
1.5.2 Tableau Online 7
1.5.3 Tableau Server 8
1.5.4 Tableau Mobile 8
1.5.5 Tableau Public 9
1.5.6 Tableau Reader 9
第2章Tableau Desktop簡介10
2.1主要新增功能11
2.1.1 Tableau 10.1新增功能11
2.1.2 Tableau 10.0新增功能11
2.1.3 Tableau 9.3新增功能12
2.1.4 Tableau 9.2新增功能12
2.2數據類型13
2.2.1主要的數據類型13
2.2.2更改數據類型14
2.3運算符及優先級15
2.3.1算術運算符15
2.3.2邏輯運算符15
2.3.3比較運算符16
2.3.4運算符優先級16
2.4軟件安裝16
2.4.1軟件下載16
2.4.2安裝步驟17
2.4.3軟件激活18
2.5軟件界面簡介19
2.5.1開始界面20
2.5.2數據源界面21
2.5.3工作簿界面22
2.6文件類型23
第3章 接數據源24
3.1連接到文件25
3.1.1 Excel文件25
3.1.2文本文件26
3.1.3 Access 27
3.1.4 JSON文件29
3.1.5統計文件30
3.1.6其他文件31
3.2連接到數據庫32
3.2 .1 Tableau Server 32
3.2.2 SQL Server 32
3.2.3 MySQL 33
3.2.4 Oracle 34
3.2.5 Amazon Redshift 34
3.2.6更多數據庫35
第4章Tableau的基礎操作38
4.1維度和度量39
4.1.1維度39
4.1.2度量40
4.2連續和離散41
4.2.1連續字段41
4.2.2離散字段41
4.3工作區操作42
4.3.1 “數據”窗格43
4.3.2 “分析”窗格44
4.3.3工具欄44
4.3.4狀態欄45
4.3.5卡和功能區46
4.3.6語言和區域設置46
4.4工作表操作47
4.4.1創建工作表47
4.4.2複製工作表47
4.4.3導出工作表48
4.4.4刪除工作表48
4.5基礎操作案例49
第5章Tableau數據導出52
5.1數據文件導出53
5.1.1導出圖形中的數據53
5.1.2導出數據源數據54
5.1.3導出交叉表數據55
5.1.4導出Access數據56
5.2導出圖形文件57
5.2.1通過複製導出57
5.2.2直接 出圖像59
5.3導出PDF格式文件60
第6章Tableau連接到Hadoop Hive 62
6.1 Hadoop簡介63
6.1.1 Hadoop分佈式文件系統63
6.1.2 MapReduce計算框架63
6.2連接基本條件64
6.2.1 Hive版本64
6.2 .2驅動程序64
6.2.3啟動Hive服務65
6.3連接主要步驟65
6.3.1 Cloudera Hadoop 65
6.3.2 Hortonworks Hadoop Hive 66
6.3.3 MapR Hadoop Hive 66
6.4連接注意事項67
6.4.1日期/時間數據67
6.4.2已知限制67
6.5檢驗測試連接68
第7章Tableau大數據引擎優化69
7.1提高連接性能70
7.2高級性能技術72
7.2.1 “篩選器”形式的分區字段72
7.2.2分組字段形式的群集字段72
7.2.3初始化SQL 72
7.3提升數據提取效率73
7.3.1存儲文件格式73
7.3.2數據分區73
7.3.3數據分組74
第8章創建圖表75
8.1單變量圖形76
8.1.1條形圖76
8.1.2餅圖78
8.1.3直方圖79
8.1.4折線圖80
8.2多變量圖形82
8.2.1散點圖82
8.2.2甘特圖83
第9章Tableau函數85
9.1數字函數86
9.2字符串函數88
9.3日 函數91
9.4類型轉換函數93
9.5邏輯函數94
9.6聚合函數96
9.7直通函數97
9.8用戶函數99
9.9表計算函數100
9.10其他函數105
9.10.1模式匹配的特定函數105
9.10.2 Hadoop Hive的特定函數106
9.10.3 GoogleBigQuery的特定函數107
第10章Tableau的高級操作109
10.1表計算110
10.2創建字段112
10.3創建參數113
10.4聚合計算118
10.5缺失值處理121
10.6案例:超市利潤額變化122
第11章創建地圖125
11.1設置角色126
11.2標記地圖126
11.3添加字段信息127
11.4設置地圖選項128
11.5創建分佈圖130
11.6自定義地圖130
第12章故事131
12.1故事簡介132
12.2創建故事133
12.3設置故事格式135
12.3.1調整標題大小135
12.3.2使儀表板適合故事136
12.3.3設置故事格式136
12.4演示故事138
第13章Tableau Online 139
13.1簡介140
13.2導航143
13.3基礎操作147
13.3.1導入數據源147
13.3.2搜索內容148
13.3.3內容操作149
13.3.4用戶設置151
13.4用戶和 組151
13.4.1用戶站點角色151
13.4.2為站點添加用戶152
13.4.3導入用戶153
13.4.4創建組154
13.4.5管理用戶156
13.5項目156
13.5.1添加項目157
13.5.2移動工作簿157
13.5.3刪除項目158
第14章Tableau Server 160
14.1安裝系統要求161
14.2軟件安裝步驟162
14.2.1準備安裝162
14.2.2軟件安裝163
14.2.3在線激活164
14.3服務器配置166
14.3.1常規配置166
14.3.2數據連接167
14.3.3服務器167
14.3.4 SMTP設置168
14.3.5通知和訂閱169
14.3.6 SSL 169
14.3.7 SAML 170
14.3.8 Kerberos 171
14.3.9 SAP HANA 172
14.3.10 OpenID 173
14.4登錄服務器174
第15章網上超市運營分析175
15.1客戶分析176
15.1.1各省市交易次數176
15.1.2各省市利潤177
15.1.3客戶散點圖178
15.1.4客戶交易量排名178
15.2配送分析179
15.2.1各省市配送情況179
15.2.2配送準時性181
15.2.3商品發貨天數181
15.2.4配送延遲商品182
15.3銷售分析183
15.3.1各個省市銷售額183
15.3.2區域銷 額184
15.3.3產品細分184
15.3.4客戶細分185
15.4利潤分析186
15.4.1產品利潤分析186
15.4.2區域利潤分析187
15.4.3區域經理業績188
15.5退貨分析188
15.5.1退貨區域分佈189
15.5.2退貨產品數量190
15.5.3退貨產品類型190
15.5.4退貨產品名稱191
15.6預測分析192
15.6.1銷售額預測192
15.6.2區域銷售預測193
15.6.3區域利潤預測194
第16章網站流量統計分析196
16.1頁面指標分析197
16.1.1頁面訪問次數197
16.1.2平均停留時間198
16.1.3區域熱門頁面198
16.2訪問量分析199
16.2.1訪問量地圖199
16.2.2各省市訪問量201
16.2.3訪問量趨勢201
16.2.4訪問量樹地圖202
16.3瀏覽量分析203
16.3.1瀏覽量地圖203
16.3.2各個省市的瀏覽量204
16.3.3區域瀏覽量205
16.3.4瀏覽量趨勢205
16.4退出量分析206
16.4.1退出量地圖206
16.4.2各省市退出量208
16.4.3區域退出量208
16.4.4退出量趨勢209
16.5下載量分析210
16.5.1下載量地 210
16.5.2各省市下載量211
16.5.3區域下載量212
16.5.4下載量趨勢212
附錄A配置ODBC數據源214
參考文獻218
作者介紹
王國平
主要從事大數據分析與研究等工作,在國內中文核心期刊發表多篇文章。
熟練掌握數據分析和可視化軟件,從事數據分析和研究工作多年,精通Tableau、SAS、SPSS Modeler、Stata、Matlab等軟件。