Apache Kylin 大數據入門 (舊名: 集華人智慧之大成:Apache Kylin 用中文處理大數據)

Apache Kylin 大數據入門 (舊名: 集華人智慧之大成:Apache Kylin 用中文處理大數據)

作者: 蔣守壯
出版社: 佳魁資訊
出版在: 2019-11-04
ISBN-13: 9789863797883
ISBN-10: 986379788X
總頁數: 384 頁




內容描述


本書全面介紹Apache Kylin,內容包含:

  ●環境架設、範例演練、原始程式分析、Cube最佳化⋯⋯等。
  ●資料倉儲、資料模型、OLAP、資料立方體⋯⋯等方面的相關知識。
  ●系統性學習與實戰操作,使讀者能夠架設以Apache Kylin為基礎的企業級大數據分析平台。
  ●熟練使用Apache Kylin多維度分析巨量資料,並透過視覺化工具展現結果。

  適用:大數據技術初學者;大數據分析人員、架構師等;亦適合Hadoop、HBase、Hive和Kylin等相關從業人員。

本書特色

  ●Apache Kylin為第一個由華人團隊完整貢獻至Apache的專案。
  ●作者為業界知名的Apache Kylin專家,本書為其多年的技術累積與實戰精華。
  ●內容淺顯易懂、實作性強大,是目前第一本系統性介紹Kylin的實作書籍。
  ●Apache Kylin為開放原始碼的分散式儲存引擎,提供Hadoop上的SQL查詢介面及多維分析能力以支援大規模資料。


目錄大綱


第一部分  Apache Kylin基礎部分
Chapter 01  Apache Kylin前世今生
1.1  Apache Kylin的背景
1.2  Apache Kylin的應用場景
1.3  Apache Kylin的發展歷程

Chapter 02  Apache Kylin前奏
2.1  事實表和維表
2.2  星型模型和雪花型模型
2.3  OLAP
2.4  資料立方體(Data Cube)

Chapter 03  Apache Kylin工作原理和系統架構
3.1  Kylin工作原理
3.2  Kylin系統架構
3.3  Kylin中的核心部分:Cube建構
3.4  Kylin的SQL查詢
3.5  Kylin的特性和生態圈

Chapter 04  架設CDH大數據平台
4.1  系統環境和安裝套件
4.2  準備工作:系統環境架設
4.3  正式安裝CDH:準備工作
4.4  正式安裝CDH5:安裝設定

Chapter 05  使用Kylin建構企業大數據分析平台的四種部署方式
5.1  Kylin部署的架構
5.2  Kylin的四種典型部署方式

Chapter 06  單獨為Kylin部署HBase叢集

Chapter 07  部署Kylin叢集環境
7.1  部署Kylin的先決條件
7.2  部署Kylin叢集環境
7.3  為Kylin叢集架設負載平衡器
 
第二部分  Apache Kylin進階部分
Chapter 08  Demo案例實戰
8.1  Sample Cube案例描述
8.2  Sample Cube案例實戰

Chapter 09  多維分析的Cube建立實戰
9.1  Cube模型
9.2  建立Cube的流程

Chapter 10  Build Cube的來龍去脈
10.1  流程分析
10.2  小結
 
第三部分  Apache Kylin進階部分
Chapter  11 Cube最佳化

Chapter  12 備份Kylin的Metadata
12.1  Kylin的中繼資料
12.2  備份中繼資料
12.3  恢復中繼資料

Chapter 13  使用Hive視圖
13.1  使用Hive視圖
13.2  使用視圖實戰

Chapter 14  Kylin的垃圾清理
14.1  清理中繼資料
14.2  清理記憶體資料

Chapter 15  JDBC 存取方式

Chapter 16  透過RESTful存取Kylin

Chapter 17  Kylin版本之間升級
17.1  從1.5.2升級到最新版本1.5.3
17.2  從1.5.1升級到1.5.2版本
17.3  從Kylin 1.5.2.1升級到Kylin 1.5.3實戰
17.4  補充內容

Chapter 18  大數據視覺化實作
18.1  視覺化工具簡述
18.2  安裝Kylin ODBC驅動
18.3  透過Excel存取Kylin
18.4  透過Power BI存取Kylin
18.5  透過Tableau存取Kylin
18.6  Kylin + Mondrian + Saiku
18.7  實戰演練:透過Saiku存取Kylin
18.8  透過Apache Zepplin存取Kylin
18.9  透過Kylin的"Insight"查詢

Chapter 19  使用Streaming Table建構准即時Cube

Chapter 20  快速資料立方演算法
20.1  快速資料立方演算法概述
20.2  快速資料立方演算法優點和缺點
20.3  取得Fast Cubing演算法的優勢
 
第四部分  Apache Kylin的擴充部分
Chapter 21  大數據智慧分析平台KAP
21.1  大數據智慧分析平台KAP概述
21.2  KAP的安裝部署


作者介紹


蔣守壯

  現就職於萬達網路科技集團有限公司,資深大數據工程師,大數據實踐者。曾任平安科技資深大數據分析師和架構師,CSDN社區專家,知識庫特約編輯。目前專注於Docker、Kubernetes、Mesos、Hadoop、Spark以及Kylin等技術領域。




相關書籍

大數據導論(通識課版)

作者 張玉宏

2019-11-04

Pro Angular 9: Build Powerful and Dynamic Web Apps

作者 Freeman Adam

2019-11-04

Clean Ruby: A Guide to Crafting Better Code for Rubyists

作者 DiLeo Carleton

2019-11-04