離線和實時大數據開發實戰
內容描述
本書分為三篇。第壹篇:從整體上給出數據大圖和數據平臺大圖,主要介紹數據的主要流程、各個流程的關鍵技術、數據的主要從業者及他們的職責等;數據平臺大圖分離線和實時分別給出數據平臺架構、關鍵數據概念和技術等;第二篇:介紹離線數據開發的主要技術,包含Hadoop、Hive、維度建模等,另外此部分還將綜合上述各種離線技術給出離線數據處理實戰;第三篇:集中介紹實時數據處理的各項技術,包含Storm、SparkSteaming、Flink、Beam等。
本書分為三篇。第壹篇:從整體上給出數據大圖和數據平臺大圖,主要介紹數據的主要流程、各個流程的關鍵技術、數據的主要從業者及他們的職責等;數據平臺大圖分離線和實時分別給出數據平臺架構、關鍵數據概念和技術等;第二篇:介紹離線數據開發的主要技術,包含Hadoop、Hive、維度建模等,另外此部分還將綜合上述各種離線技術給出離線數據處理實戰;第三篇:集中介紹實時數據處理的各項技術,包含Storm、SparkSteaming、Flink、Beam等。