Tableau 數據可視化從入門到精通

Tableau 數據可視化從入門到精通

作者: 王國平
出版社: 清華大學
出版在: 2017-07-01
ISBN-13: 9787302473770
ISBN-10: 7302473773
裝訂格式: 平裝
總頁數: 217 頁





內容描述


本書由專業的數據分師根據新版Tbaleau 10精心編撰,全書以Tableau桌面軟件Desktop為主線,詳盡介紹了Tableau的基本概念、術語及數據分析與可視化的各種功能和知識。
介紹了連接多種數據源,包括Excel、文本文件、Access、JSON文件、統計文件及SQL Server、MySQL、Oracle等數據庫,同時介紹了連接大數據平臺Hadoop Hive以及大數據引擎的優化。
介紹瞭如何在Tableau中創建圖表、使用函數、創建地圖、創建故事表,並配合案例進行分析。
介紹了Tableau Online和Tableau Server的使用和操作技巧。
通過網上超市運營分析和網站流量統計分析兩個商業案例深入介紹了Tableau的應用技巧,幫助讀者盡快將Tableau的強大功能應用於工作實踐。


目錄大綱


第1章數據可視化及Tableau概述1 
1.1大數據時代的挑戰2 
1.2大數據可視化的難點2 
1.3可視化技術的新特性3 
1.4主要的數據可視化軟件4 
1.4.1 Tableau 4 
1.4.2 QlikView 4 
1.4. 3 ECharts 5 
1.4.4 HighCharts 5 
1.5 Tableau軟件概況5 
1.5.1 Tableau Desktop 6 
1.5.2 Tableau Online 7 
1.5.3 Tableau Server 8 
1.5.4 Tableau Mobile 8 
1.5.5 Tableau Public 9 
1.5.6 Tableau Reader 9 
第2章Tableau Desktop簡介10 
2.1主要新增功能11 
2.1.1 Tableau 10.1新增功能11 
2.1.2 Tableau 10.0新增功能11 
2.1.3 Tableau 9.3新增功能12 
2.1.4 Tableau 9.2新增功能12 
2.2數據類型13 
2.2.1主要的數據類型13 
2.2.2更改數據類型14 
2.3運算符及優先級15 
2.3.1算術運算符15 
2.3.2邏輯運算符15 
2.3.3比較運算符16 
2.3.4運算符優先級16 
2.4軟件安裝16 
2.4.1軟件下載16 
2.4.2安裝步驟17 
2.4.3軟件激活18 
2.5軟件界面簡介19 
2.5.1開始界面20 
2.5.2數據源界面21 
2.5.3工作簿界面22 
2.6文件類型23 
第3章 接數據源24 
3.1連接到文件25 
3.1.1 Excel文件25 
3.1.2文本文件26 
3.1.3 Access 27 
3.1.4 JSON文件29 
3.1.5統計文件30 
3.1.6其他文件31 
3.2連接到數據庫32 
3.2 .1 Tableau Server 32 
3.2.2 SQL Server 32 
3.2.3 MySQL 33 
3.2.4 Oracle 34 
3.2.5 Amazon Redshift 34 
3.2.6更多數據庫35 
第4章Tableau的基礎操作38 
4.1維度和度量39 
4.1.1維度39 
4.1.2度量40 
4.2連續和離散41 
4.2.1連續字段41 
4.2.2離散字段41 
4.3工作區操作42 
4.3.1 “數據”窗格43 
4.3.2 “分析”窗格44 
4.3.3工具欄44 
4.3.4狀態欄45 
4.3.5卡和功能區46 
4.3.6語言和區域設置46 
4.4工作表操作47 
4.4.1創建工作表47 
4.4.2複製工作表47 
4.4.3導出工作表48 
4.4.4刪除工作表48 
4.5基礎操作案例49 
第5章Tableau數據導出52 
5.1數據文件導出53 
5.1.1導出圖形中的數據53 
5.1.2導出數據源數據54 
5.1.3導出交叉表數據55 
5.1.4導出Access數據56 
5.2導出圖形文件57 
5.2.1通過複製導出57 
5.2.2直接 出圖像59 
5.3導出PDF格式文件60 
第6章Tableau連接到Hadoop Hive 62 
6.1 Hadoop簡介63 
6.1.1 Hadoop分佈式文件系統63 
6.1.2 MapReduce計算框架63 
6.2連接基本條件64 
6.2.1 Hive版本64 
6.2 .2驅動程序64 
6.2.3啟動Hive服務65 
6.3連接主要步驟65 
6.3.1 Cloudera Hadoop 65 
6.3.2 Hortonworks Hadoop Hive 66 
6.3.3 MapR Hadoop Hive 66 
6.4連接注意事項67 
6.4.1日期/時間數據67 
6.4.2已知限制67 
6.5檢驗測試連接68 
第7章Tableau大數據引擎優化69 
7.1提高連接性能70 
7.2高級性能技術72 
7.2.1 “篩選器”形式的分區字段72 
7.2.2分組字段形式的群集字段72 
7.2.3初始化SQL 72 
7.3提升數據提取效率73 
7.3.1存儲文件格式73 
7.3.2數據分區73 
7.3.3數據分組74 
第8章創建圖表75 
8.1單變量圖形76 
8.1.1條形圖76 
8.1.2餅圖78 
8.1.3直方圖79 
8.1.4折線圖80 
8.2多變量圖形82 
8.2.1散點圖82 
8.2.2甘特圖83 
第9章Tableau函數85 
9.1數字函數86 
9.2字符串函數88 
9.3日 函數91 
9.4類型轉換函數93 
9.5邏輯函數94 
9.6聚合函數96 
9.7直通函數97 
9.8用戶函數99 
9.9表計算函數100 
9.10其他函數105 
9.10.1模式匹配的特定函數105 
9.10.2 Hadoop Hive的特定函數106 
9.10.3 GoogleBigQuery的特定函數107 
第10章Tableau的高級操作109 
10.1表計算110 
10.2創建字段112 
10.3創建參數113 
10.4聚合計算118 
10.5缺失值處理121 
10.6案例:超市利潤額變化122 
第11章創建地圖125 
11.1設置角色126 
11.2標記地圖126 
11.3添加字段信息127 
11.4設置地圖選項128 
11.5創建分佈圖130 
11.6自定義地圖130 
第12章故事131 
12.1故事簡介132 
12.2創建故事133 
12.3設置故事格式135 
12.3.1調整標題大小135 
12.3.2使儀表板適合故事136 
12.3.3設置故事格式136 
12.4演示故事138 
第13章Tableau Online 139 
13.1簡介140 
13.2導航143 
13.3基礎操作147 
13.3.1導入數據源147 
13.3.2搜索內容148 
13.3.3內容操作149 
13.3.4用戶設置151 
13.4用戶和 組151 
13.4.1用戶站點角色151 
13.4.2為站點添加用戶152 
13.4.3導入用戶153 
13.4.4創建組154 
13.4.5管理用戶156 
13.5項目156 
13.5.1添加項目157 
13.5.2移動工作簿157 
13.5.3刪除項目158 
第14章Tableau Server 160 
14.1安裝系統要求161 
14.2軟件安裝步驟162 
14.2.1準備安裝162 
14.2.2軟件安裝163 
14.2.3在線激活164 
14.3服務器配置166 
14.3.1常規配置166 
14.3.2數據連接167 
14.3.3服務器167 
14.3.4 SMTP設置168 
14.3.5通知和訂閱169 
14.3.6 SSL 169 
14.3.7 SAML 170 
14.3.8 Kerberos 171 
14.3.9 SAP HANA 172 
14.3.10 OpenID 173 
14.4登錄服務器174 
第15章網上超市運營分析175 
15.1客戶分析176 
15.1.1各省市交易次數176 
15.1.2各省市利潤177 
15.1.3客戶散點圖178 
15.1.4客戶交易量排名178 
15.2配送分析179 
15.2.1各省市配送情況179 
15.2.2配送準時性181 
15.2.3商品發貨天數181 
15.2.4配送延遲商品182 
15.3銷售分析183 
15.3.1各個省市銷售額183 
15.3.2區域銷 額184 
15.3.3產品細分184 
15.3.4客戶細分185 
15.4利潤分析186 
15.4.1產品利潤分析186 
15.4.2區域利潤分析187 
15.4.3區域經理業績188 
15.5退貨分析188 
15.5.1退貨區域分佈189 
15.5.2退貨產品數量190 
15.5.3退貨產品類型190 
15.5.4退貨產品名稱191 
15.6預測分析192 
15.6.1銷售額預測192 
15.6.2區域銷售預測193 
15.6.3區域利潤預測194 
第16章網站流量統計分析196 
16.1頁面指標分析197 
16.1.1頁面訪問次數197 
16.1.2平均停留時間198 
16.1.3區域熱門頁面198 
16.2訪問量分析199 
16.2.1訪問量地圖199 
16.2.2各省市訪問量201 
16.2.3訪問量趨勢201 
16.2.4訪問量樹地圖202 
16.3瀏覽量分析203 
16.3.1瀏覽量地圖203 
16.3.2各個省市的瀏覽量204 
16.3.3區域瀏覽量205 
16.3.4瀏覽量趨勢205 
16.4退出量分析206 
16.4.1退出量地圖206 
16.4.2各省市退出量208 
16.4.3區域退出量208 
16.4.4退出量趨勢209 
16.5下載量分析210 
16.5.1下載量地 210 
16.5.2各省市下載量211 
16.5.3區域下載量212 
16.5.4下載量趨勢212 
附錄A配置ODBC數據源214 
參考文獻218


作者介紹


王國平
主要從事大數據分析與研究等工作,在國內中文核心期刊發表多篇文章。
熟練掌握數據分析和可視化軟件,從事數據分析和研究工作多年,精通Tableau、SAS、SPSS Modeler、Stata、Matlab等軟件。




相關書籍

Julia 機器學習核心編程:人人可用的高性能科學計算

作者 朱紅慶 王鋒

2017-07-01

Python編程:從數據分析到數據科學

作者 朝樂門

2017-07-01

預測之美:機器學習及深度學習真實生活應用

作者 游皓麟

2017-07-01