Spark最佳實踐
內容描述
<內容簡介>
本書是Spark實戰指南,全書共分8章。前4章介紹Spark的部署、工作機制和內核,後4章分別通過實戰項目介紹Spark SQL、Spark Streaming、Spark GraphX和Spark MLib功能模塊。此外,本書詳細介紹了常見的實戰問題,比如大數據環境下的配置設置、程序調優等。本書附帶的一鍵安裝腳本,更能為初學者提供很大幫助。
<作者簡介>
陳歡
騰訊資深程序員,15年編碼經驗,曾任職網絡安全、因特網金融等部門,親手從零建設了財付通業務的Spark集群,並使之同時支持SQL、實時計算、機器學習等多種數據計算場景。他目前就職於騰訊社交與效果廣告部,從事大數據分析工作。
林世飛
騰訊資深研究員,2005年加入騰訊,先後在無線產品、安全中心、搜索平臺、開放平臺、社交與效果廣告部等部門從事開發和團隊管理工作。他對網絡安全、搜索引擎、數據挖掘、機器學習有一定瞭解,熱衷知識傳播和分享,曾獲騰訊學院2009年年度講師。目前,他就職於社交與效果廣告部,負責廣告系統相關的研發工作。