Python+Superset:商業智能數據分析與實戰

Python+Superset:商業智能數據分析與實戰

作者: 王國平
出版社: 電子工業
出版在: 2022-02-01
ISBN-13: 9787121428654
ISBN-10: 7121428652
總頁數: 248 頁





內容描述


本書通過實際案例深入介紹了基於Python的開源商業智能工具Apache Superset。本書立足於為企業建立一套開源免費的BI(商業智能)數據分析平臺,實現自助數據處理、數據分析、數據可視化,概述了該系統的基本情況、總體需求、解決方案和業務理解等。本書從企業BI系統建設的實際需求出發,詳細闡述了商業智能系統開發的概念、流程及相關技術,同時結合實際案例介紹了基於Apache Superset的最新且常用的商業智能技術,包括Redis、Hive、Presto、Vertica、ClickHouse、TiDB、Dremio等。


目錄大綱


第1章 商業智能概述 1
1.1 商業智能簡介 1
1.1.1 商業智能的發展 1
1.1.2 商業智能的價值 3
1.1.3 商業智能的流程 4
1.2 商業智能技術 4
1.2.1 數據倉庫技術 4
1.2.2 ETL技術 6
1.2.3 數據可視化技術 6
1.3 幾個概念的比較 10
1.3.1 商業智能與報表工具 10
1.3.2 商業智能與數據分析 11
1.3.3 商業智能與數據可視化 11
第2章 系統開發需求分析 12
2.1 項目背景概述 12
2.1.1 項目意義與需求 12
2.1.2 項目目標、系統設計與階段劃分 16
2.2 平臺總體需求 18
2.2.1 平臺總體規劃 19
2.2.2 平臺用戶角色 20
2.3 解決方案概述 21
2.3.1 BI平臺功能簡介 21
2.3.2 BI平臺總體架構 22
2.4 業務數據理解 23
2.4.1 表及其字段含義 24
2.4.2 重要需求點闡述 28
第3章 系統開發相關技術 31
3.1 系統主要軟件 31
3.1.1 Hadoop 31
3.1.2 Python 34
3.1.3 Apache Superset 35
3.2 數據倉庫技術 37
3.2.1 數據倉庫構建過程 37
3.2.2 數據倉庫拉鏈算法 38
3.3 Apache Superset的安裝 39
3.3.1 在Docker中部署Apache Superset 39
3.3.2 在Windows下安裝Apache Superset 44
第4章 Apache Superset連接數據源 47
4.1 讀取本地數據 47
4.1.1 讀取CSV文件 47
4.1.2 讀取TXT文件 51
4.2 連接關系型數據庫 51
4.2.1 安裝驅動程序 52
4.2.2 配置連接參數 53
4.2.3 添加數據庫表 58
第5章 Apache Superset基礎操作 61
5.1 Apache Superset可視化分析 61
5.1.1 SQL Lab提取數據 61
5.1.2 製作報表與看板 64
5.2 Apache Superset用戶管理 68
5.2.1 創建新的系統用戶 68
5.2.2 刪除已有系統用戶 70
5.2.3 查看用戶日誌記錄 71
5.3 Apache Superset角色管理 72
5.3.1 設置用戶角色類型 73
5.3.2 創建新的用戶角色 73
5.3.3 修改用戶角色類型 75
5.4 Apache Superset看板設置與編輯 77
5.4.1 Apache Superset看板設置 77
5.4.2 Apache Superset看板編輯 81
第6章 Apache Superset前端集成開發 84
6.1 前端開發概述 84
6.1.1 HTML及其應用案例 84
6.1.2 JavaScript及其特點 88
6.2 系統參數設置 89
6.3 Apache Superset前端集成實戰 90
6.3.1 報表嵌入Web頁面 90
6.3.2 看板嵌入Web頁面 97
第7章 Apache Superset系統性能優化 100
7.1 系統性能優化 100
7.2 搭建開發環境 102
7.2.1 Redis緩存概述 102
7.2.2 配置Redis環境 104
7.3 集成開發實戰 106
7.3.1 測試集成前看板 106
7.3.2 刷新集成後看板 108
第8章 Apache Superset與數據倉庫 109
8.1 數據倉庫概述 109
8.1.1 傳統數據倉庫 109
8.1.2 大數據數據倉庫 111
8.2 Apache Superset集成Hive 113
8.2.1 Hive數據倉庫概述 113
8.2.2 搭建Hive開發環境 115
8.3 物流配送影響因素分析 117
第9章 Apache Superset與實時計算引擎 121
9.1 實時計算引擎概述 121
9.1.1 實時計算應用場景 121
9.1.2 實時計算重要架構 123
9.2 Apache Superset集成Presto 126
9.2.1 Presto計算引擎概述 126
9.2.2 搭建Presto開發環境 128
9.3 網購退貨原因分析 132
9.3.1 網購退貨主要原因 132
9.3.2 個人原因退貨分析 134
第10章 Apache Superset與列式存儲引擎 136
10.1 列式存儲引擎 136
10.2 Apache Superset集成Vertica 138
10.2.1 Vertica存儲引擎概述 138
10.2.2 搭建Vertica開發環境 140
10.3 客戶流失原因分析 144
10.3.1 客戶流失主要原因 144
10.3.2 客戶流失服務因素分析 145
第11章 Apache Superset與聯機分析處理 147
11.1 聯機分析處理概述 147
11.1.1 聯機分析處理特性 147
11.1.2 聯機分析處理操作 149
11.2 Apache Superset集成ClickHouse 150
11.2.1 ClickHouse存儲引擎概述 151
11.2.2 搭建ClickHouse開發環境 152
13.3 商家物流運營分析 155
11.3.1 物流運營主要模式 156
11.3.2 商家交貨周期分析 157
第12章 Apache Superset與混合事務分析處理 159
12.1 混合事務分析處理 159
12.1.1 混合事務分析處理概述 159
12.1.2 混合事務分析處理操作 161
12.2 Apache Superset集成TiDB 163
12.2.1 TiDB存儲引擎概述 163
12.2.2 搭建TiDB開發環境 166
12.3 物流配送溝通性 168
12.3.1 物流配送溝通性概述 169
12.3.2 物流配送溝通性分析 169
第13章 Apache Superset與數據湖引擎 172
13.1 數據湖引擎 172
13.1.1 數據湖引擎概述 172
13.1.2 數據湖與數據倉庫 173
13.2 Apache Superset集成Dremio 174
13.2.1 Dremio引擎概述 175
13.2.2 搭建Dremio開發環境 176
13.3 客戶流失價格因素 182
13.3.1 客戶流失價格因素概述 182
13.3.2 客戶流失價格因素分析 182
第14章 客戶細分主題分析 184
14.1 客戶細分的價值及其方法 184
14.1.1 客戶細分的概念 184
14.1.2 客戶細分的目的 185
14.1.3 客戶細分的方法 185
14.2 基於客戶屬性的客戶細分 187
14.2.1 提取SQL數據庫數據 187
14.2.2 製作可視化分析報表 188
14.2.3 基於屬性的細分看板 192
14.3 基於客戶價值的客戶細分 193
14.3.1 提取SQL數據庫數據 193
14.3.2 製作可視化分析報表 194
14.3.3 基於價值的細分看板 198
14.4 基於消費行為的客戶細分 199
14.4.1 RFM模型及客戶價值類型 199
14.4.2 提取與清洗SQL數據 200
14.4.3 製作可視化分析報表 204
14.4.4 基於行為的細分看板 208
14.5 對細分客戶進行營銷 208

第15章 客戶滿意度主題分析 211
15.1 客戶滿意度概述 211
15.2 客戶滿意信賴度分析 214
15.3 客戶滿意專業度分析 215
15.4 客戶滿意有形度分析 217
15.5 客戶滿意同理度分析 218
15.6 客戶滿意反應度分析 220
15.7 提升客戶滿意度 221
附錄A 安裝Python 3.10.0 224
附錄B 集群各節點的參數配置 228
B.1 Hadoop的參數配置 228
B.2 Hive的參數配置 231
B.3 集群的啟動與關閉 233
附錄C 數據源及其連接方式 234




相關書籍

R語言實戰, 2/e (R in Action: Data Analysis and Graphics with R, 2/e)

作者 卡巴科弗 (Robert I.Kabacoff)

2022-02-01

Circuits, Signals and Systems for Bioengineers, Third Edition: A MATLAB-Based Introduction (Biomedical Engineering)

作者 John Semmlow

2022-02-01

Learn CUDA Programming

作者 Jaegeun Han Bharatkumar Sharma

2022-02-01