Spark 大數據處理技術

Spark 大數據處理技術

作者: 夏俊鸞 程浩 邵賽賽
出版社: 電子工業
出版在: 2015-01-01
ISBN-13: 9787121250811
ISBN-10: 7121250810
裝訂格式: 平裝
總頁數: 356 頁





內容描述


<內容簡介>
   夏俊鸞、劉旭暉、邵賽賽、程浩、史鳴飛等編著的《Spark大數據處理技術》以Spark 0.9版本為基礎進行編寫,是一本全面介紹spark及spark生態圈相關技術的書籍,是國內首本深入介紹spark原理和架構的技術書籍。主要內容有spark基礎功能介紹及內部重要模塊分析,包括部署模式、調度框架、存儲管理以及應用監控;同時也詳細介紹了spark生態圈中其他的軟件和模塊,包括SQL處理引擎Shark和spark SQL、流式處理引擎Spark streaming、圖計算框架Grrdphx以及分佈式內存文件系統Tachyon。本書從概念和原理上對spark核心框架和生態圈做了詳細的解讀,並對spark的應用現狀和未來發展做了一定的介紹,旨在為大數據從業人員和spark愛好者提供一個更深入學習的平臺。    本書適合任何大數據、spark領域的從業人員閱讀,同時也為架構師、軟件開發工程師和大數據愛好者展現了一個現代大數據框架的架構原理和實現細節。相信通過學習本書,讀者能夠熟悉和掌握Spark這一當前流行的大數據框架,並將其投入到生產實踐中去。

<章節目錄>
第1章 Spark系統概述  1.1 大數據處理框架  1.2  Spark大數據處理框架    1.2.1  RDD表達能力    1.2.2  Spark子系統  1.3 小結第2章 Spark RDD及編程接口  2.1  Spark程序「Hello World」  2.2  Spark RDD    2.2.1  RDD分區(partitions)    2.2.2  RDD優先位置(preferredLocations)    2.2.3  RDD依賴關係(dependencies)    2.2.4  RDD分區計算(compute)    2.2.5  RDD分區函數(partitioner)  2.3 創建操作    2.3.1 集合創建操作    2.3.2 存儲創建操作  2.4 轉換操作    2.4.1 RDD基本轉換操作    2.4.2 鍵值RDD轉換操作    2.4.3 再論RDD依賴關係  2.5 控制操作(control operation)  2.6 行動操作(action operation)    2.6.1 集合標量行動操作    2.6.2 存儲行動操作  2.7 小結第3章 Spark運行模式及原理  3.1  Spark運行模式概述    3.1.1  Spark運行模式列表    3.1.2  Spark基本工作流程    3.1.3 相關基本類  3.2  Local模式    3.2.1 部署及程序運行    3.2.2 內部實現原理  3.3  Standalone模式    3.3.1 部署及程序運行    3.3.2 內部實現原理  3.4  Local cluster模式    3.4.1 部署及程序運行第4章 Spark調度管理原理第5章 Spark的存儲管理第6章 Spark監控管理第7章 Spark架構與安裝配置第8章 SQL程序擴展第9章 Spark SQL第10章 Spark Streaming流數據處理框架第11章 GraphX計算框架第12章 Tachyon存儲系統




相關書籍

雲計算和邊緣計算中的網絡管理

作者 張宇超 徐恪

2015-01-01

HTML+CSS3+jQuery網頁設計案例教程

作者 劉培林 汪菊琴

2015-01-01

大數據數學基礎 (Python語言描述)

作者 雷俊麗 張良均

2015-01-01