大數據離線分析(高等院校數據科學與大數據技術系列規劃教材)

大數據離線分析(高等院校數據科學與大數據技術系列規劃教材)

作者: 傅德謙 趙向兵 張林濤 劉鳴濤
出版社: 清華大學
出版在: 2017-08-29
ISBN-13: 9787302483298
ISBN-10: 7302483299
裝訂格式: 平裝
總頁數: 169 頁





內容描述


本書基於開源Hadoop大數據生態圈的主流離線分析工具Hive和Pig,通過技術講解和案例實戰相結合的方式,介紹了海量數據離線分析的技術方法。本書內容主要包括Hive數據庫表、基於HiveQL的常規操作、視圖、索引和Pig等數據處理分析和基礎工具知識,Hive函數、Pig Latin編程、ETL工具Sqoop和工作流引擎Oozie等相關高級技術,以及實際項目案例。本書既可供學習大數據離線分析技術的本科和高職高專學生作為教材,也可供從事數據分析相關工作的技術人員作為參考資料。




相關書籍

數據挖掘算法——基於C++及CUDA C

作者 Timothy Masters 周書鋒 連曉峰

2017-08-29

構建實時機器學習系統

作者 彭河森 汪涵

2017-08-29

Python 數據分析從入門到實踐

作者 明日科技編

2017-08-29