精通 Azure Analytics|在雲端上使用 Azure Data Lake、HDInsight 與 Spark (Mastering Azure Analytics : Architecting in the Cloud with Azure Data Lake, HDInsight, and Spark)

精通 Azure Analytics|在雲端上使用 Azure Data Lake、HDInsight 與 Spark (Mastering Azure Analytics : Architecting in the Cloud with Azure Data Lake, HDInsight, and Spark)

作者: Zoiner Tejada 沈佩誼
出版社: 歐萊禮
出版在: 2018-10-01
ISBN-13: 9789864769209
ISBN-10: 9864769200
總頁數: 424 頁





內容描述


為了儲存、處理及分析各式各樣規模、形式及擷取速度的資料,Microsoft Azure提供超過25種「平台即服務(PaaS)」選項,幫助使用者完整建置資料分析管線。如何為你的組織需求選定最適切的服務?本書列舉一個實用且具體的參考框架,引導你借助Azure服務,打造屬於自己的巨量資料分析解決方案。
 
本書作者Zoiner Tejada首先介紹諸如Lambda資料架構及資料湖等基本概念,接著帶領讀者仔細探討資料分析管線中每一階段的程式碼範例。為了幫助使用者在每一階段選擇並應用適當的Azure服務,作者利用一則貫穿全書的案例研究,引導讀者瞭解如何在現實情境中應用Azure服務及相應程式碼。
 
.了解如何超大規模存放資料
.設計並實作解決方案,迅速提供「熱」查詢結果,並正確產生「冷」結果。
.批次處理資料,以「即時微批次」或「一次一tuple」的方式處理串流資料。
.將機器學習功能整合到資料分析管線。
.管理、治理與保護你的資料資產。
.使用C#、Scala及Java的範例程式碼,以及現行資料分析管線內服務的原生語言
 
Zoiner Tejada是一位在雲端運算、大數據、資料分析及機器學習等領域中具備專業知識的軟體工程架設師。在Azure及資料平台(Data Platform)兩個領域中,Microsoft皆授與他MVP(最有價值專家)榮譽認證。
 
 
「如果您在設計資料分析策略時感到迷茫困惑,本書將是導引你離開無助荒野的求生指南。」 —Microsoft Azure CAT資深專案經理 Rama Ramani




相關書籍

深入剖析 Kubernetes

作者 張磊

2018-10-01

Site Reliability Engineering: How Google Runs Production Systems (Paperback)

作者 Niall Richard Murphy Betsy Beyer Chris Jones Jennifer Petoff

2018-10-01

OpenStack 雲平臺部署與高可用實戰

作者 肖睿 雷宇飛

2018-10-01