Hadoop 大數據技術開發實戰
內容描述
本書以Hadoop及其周邊框架為主線,介紹了整個Hadoop生態系統主流的大數據開發技術。全書共16章,第1章講解了VMware中CentOS 7操作系統的安裝;第2章講解了大數據開發之前對操作系統集群環境的配置;第3~16章講解了Hadoop生態系統各框架HDFS、MapReduce、YARN、ZooKeeper、HBase、Hive、Sqoop和數據實時處理系統Flume、Kafka、Storm、Spark以及分佈式搜索系統Elasticsearch等的基礎知識、架構原理、集群環境搭建,同時包括常用的Shell命令、API操作、源碼剖析,並通過實際案例加深對各個框架的理解與應用。通過閱讀本書,讀者即使沒有任何大數據基礎,也可以對照書中的步驟成功搭建屬於自己的大數據集群並獨立完成項目開發。 本書可作為Hadoop新手入門的指導書,也可作為大數據開發人員的隨身手冊以及大數據從業者的參考用書。