認識大數據的第一本書
內容描述
完整的大數據概論 大數據是無所不包的名詞,它代表無法使用傳統資料管理工具來管理十分大量、快速、且高度多樣又複雜的資料。
理想上大數據包含了所有資料類型,可用來協助我們在正確的時間,以正確的數量,傳達正確的資訊給適當的人,最終協助人們做出正確決策。
本書將為管理階層與資料科學家提供完整的大數據概論。涵蓋大數據的關鍵挑戰與優點,以及組織所需的必備工具與技術,還有能從大數據獲得的好處。
本書涵蓋內容包括: .大數據的商業應用 .頂尖組織如何應用大數據 .大數據的生態系統 .大數據的應用、入門與教學
目錄大綱
第1章|大數據整體介紹
第2章|大數據來源與應用
第3章|大數據架構
第4章|使用 Hadoop 進行分散式運算
第5章|運用 MapReduce 進行平行處理
第6章|NoSQL 資料庫
第7章|運用 Spark 進行串流處理
第8章|提取資料
第9章|雲端運算
第10章|網路日誌分析器應用程式個案研究
第11章|資料探勘入門
第12章|大數據程式設計入門
附錄 A|在 Virtual Box 上使用 Cloudera 安裝 Hadoop
附錄 B|在 Amazon Web Services (AWS) Elastic Compute Cluster (EC2) 上安裝 Hadoop
附錄 C|Spark 安裝與教學 "