Hadoop數據分析
內容描述
通過提供分佈式數據存儲和並行計算框架,Hadoop已經從一個集群計算的抽象演化成了一個大數據的操作系統。本書旨在通過以可讀且直觀的方式提供集群計算和分析的概覽,為數據科學家深入瞭解特定主題領域鋪平道路,從數據科學家的視角介紹Hadoop集群計算和分析。本書分為兩大部分, 一部分從非常高的層次介紹分佈式計算,討論如何在集群上運行計算; 二部分則重點關註數據科學家應該瞭解的工具和技術,意在為各種分析和大規模數據管理提供動力。
通過提供分佈式數據存儲和並行計算框架,Hadoop已經從一個集群計算的抽象演化成了一個大數據的操作系統。本書旨在通過以可讀且直觀的方式提供集群計算和分析的概覽,為數據科學家深入瞭解特定主題領域鋪平道路,從數據科學家的視角介紹Hadoop集群計算和分析。本書分為兩大部分, 一部分從非常高的層次介紹分佈式計算,討論如何在集群上運行計算; 二部分則重點關註數據科學家應該瞭解的工具和技術,意在為各種分析和大規模數據管理提供動力。