深入理解 Flink:實時大數據處理實踐
內容描述
本書介紹了當下最流行的實時數據處理引擎Flink,講解了流處理API、批處理API、機器學習引擎FlinkML、關系型API、復雜事件處理FLinkCEP,以及指標度量與部署模式。此外,本書展開分析了流式數據處理理論中時間、窗口、水印、觸發器、遲到生存期之間的關聯關系;深入分析了多項式曲線擬合、分類算法SVM、推薦算法ALS-WR的理論和FlinkML實現。希望快速上手Flink以開展實時大數據處理與在線機器學習應用的從業者,本書是不二的選擇:本書首先介紹相關概念引入的原因、解決方案的演進過程、Flink的對應架構、編程案例以及開放式的思考問題。