大數據離線分析(高等院校數據科學與大數據技術系列規劃教材)

大數據離線分析(高等院校數據科學與大數據技術系列規劃教材)

作者: 傅德謙 趙向兵 張林濤 劉鳴濤
出版社: 清華大學
出版在: 2017-08-29
ISBN-13: 9787302483298
ISBN-10: 7302483299
裝訂格式: 平裝
總頁數: 169 頁





內容描述


本書基於開源Hadoop大數據生態圈的主流離線分析工具Hive和Pig,通過技術講解和案例實戰相結合的方式,介紹了海量數據離線分析的技術方法。本書內容主要包括Hive數據庫表、基於HiveQL的常規操作、視圖、索引和Pig等數據處理分析和基礎工具知識,Hive函數、Pig Latin編程、ETL工具Sqoop和工作流引擎Oozie等相關高級技術,以及實際項目案例。本書既可供學習大數據離線分析技術的本科和高職高專學生作為教材,也可供從事數據分析相關工作的技術人員作為參考資料。




相關書籍

An Introduction to Machine Learning 2/e

作者 Miroslav Kubat

2017-08-29

少年 Py 的大冒險 - 成為 Python 數據分析達人的第一門課 (附範例光碟)

作者 蔡炎龍 季佳琪 陳先灝

2017-08-29

MXNet 深度學習實戰

作者 魏凱峰

2017-08-29