Spark權威指南

Spark權威指南

作者: Bill Chambers Matei Zaharia 張岩峰
出版社: 中國電力
出版在: 2020-04-01
ISBN-13: 9787519840099
ISBN-10: 7519840093
裝訂格式: 平裝
總頁數: 552 頁





內容描述


主要內容
·大數據技術和Spark概述。
·通過實例學習DataFrame、SQL、Dataset等Spark的核心API。
·了解Spark的低級API實現,包括RDD以及SQL和DataFrame的執行過程。
·了解Spark如何在集群上運行。
·Spark集群和應用程序的調試、監控、和調優。
·學習Spark強大的流處理引擎——結構化流處理。
·學習MLlib並了解如何應用它解決包括分類、推薦,以及其他多種實際問題。


作者介紹


Bill Chambers
是Databricks的一名產品經理,致力於使用Spark和Databricks幫助客戶完成大規模數據分析的任務。
Bill還定期寫關於數據科學和大數據方面的博客, 並常在各種會議和見面會上展示產品。
他擁有加州大學伯克利分校信息學院的信息系統碩士學位, 研究方向為數據科學。
Matei Zaharia
是斯坦福大學計算機科學系助理教授和Databricks的首席技術官。
他於2009年在加州大學伯克利分校創立了Spark項目,
那時他是一名博士生, 並繼續擔任Apache Spark項目的副主席。
Matei Zaharia還是Apache Mesos項目的聯合創始人,
也是Apache Hadoop項目的貢獻者。
Matei Zaharia以他出色的研究工作獲得了2014年美國計算機學會博士論文獎和VMware系統研究獎。

譯者介紹
張岩峰
東北大學教授,在國內外從事大數據分佈式處理研究工作10餘年,中國計算機學會數據庫專委會委員,
大數據專委會通訊委員,研究設計了iMapReduce、Maiter等大數據迭代計算分佈式框架,
承擔和參與國家自然科學基金、國家重點研發計劃等多項課題,
在SIGMOD、VLDB、ICDE、PPoPP、TPDS、TKDE等頂D級國際會議和期刊上發表論文10餘篇,
曾獲雲計算國際會議ACM SOCC 2011優秀論文獎及多項國內外獎勵和榮譽。




相關書籍

大數據技術入門(微課視頻+題庫版)

作者 黃源 李兵川 何浩 鄧宇沁 楊瑞峰

2020-04-01

大數據時代

作者 趙國棟 易歡歡 糜萬軍 鄂維南

2020-04-01

Integrating PHP with Windows (Paperback)

作者 Arno Hollosi

2020-04-01