Spark:大數據集群計算的生產實踐
內容描述
本書針對spark從驗證性環境遷移到實際生產環境時會遇到的各種問題給出了實際的幫助,涵蓋了開發及維護生產級Spark應用的各種方法、組件與有用實踐。全書分為6章,第1 ~ 2章幫助讀者深入理解Spark的內部機制以及它們在生產流程中的含義;第3章和第5章闡述了針對配置參數的法則和權衡方案,用來調優Spark,改善性能,獲得高可用性和容錯性;第4章專門討論Spark應用中的安全問題;第6章則全面介紹生產流,以及把一個應用遷移到一個生產工作流中時所需要的各種組件,同時對Spark生態系統進行了梳理。