Hadoop - YARN 核心技術 (舊名: 深入研究 Hadoop - YARN 核心技術)
內容描述
資深Hadoop - YARN專家最新力作
■ 涵蓋Hadoop的架構、重要元件、主要計算模型、資源排程
■ 理論與實作結合,透過實際常式降低讀者學習難度
■ 具實戰性,部分案例直接選自BAT中的工程實例
作者從事分散式教學與研究十餘年,與國內外頂尖公司的交流中, 發現Hadoop很適合作為一個分散式課程教學實作與研究平台,因此編著本書,有系統地介紹Hadoop - YARN的基本概念與運行模式。
內容涵蓋Hadoop的架構、重要元件、主要計算模型、資源排程等重要問題。
適用:分散式、雲端運算平台學習者,或提供業界研發人員的工程實作參考。
目錄大綱
前言
第1 章 YARN 的前世今生
1.1 Hadoop 基本情況回顧
1.2 為什麼我們需要YARN
1.3 YARN 和Hadoop 1.0 比較分析
1.4 Hadoop 生態系統
1.5 小結
第2 章YARN 基本架構
2.1 YARN 基本架構
2.2 ResourceManager
2.3 NodeManager
2.4 ApplicationMaster
2.5 YARN 中應用程式的執行過程
第3 章程式設計初步
3.1 YARN 安裝與設定
3.2 原始程式閱讀及編譯
3.3 MapReduce 實例
3.4 HBase 程式設計初步
第4 章 YARN 核心元件分析
4.1 通訊元件Protocol Buffer
4.2 Hadoop 1.0 RPC 和YARN RPC
4.3 YARN 狀態機分析
4.4 4.4 HDFS Federation
第5 章 YARN 中幾種計算模型
5.1 以YARN 為基礎的MapReduce 進階
5.2 Storm on YARN
5.3 Spark on YARN
第6 章 YARN 資源排程器
6.1 Hadoop 資源排程器回顧
6.2 YARN 資源排程器
6.3 YARN 排程負載模擬器-SLS
6.4 Google 第三代排程器分析
第7 章 YARN 工作流分析
7.1 Tez on YARN
7.2 顯性工作流引擎