雲端 & 區塊鏈必備技能 Hadoop 大數據高效處理實戰範典 (舊名: 科技巨頭:Hadoop+Spark大規模實際運作進行式)
內容描述
內容簡介
1. 全面實用地論述了從實際應用中分析出的資料採擷和Hadoop 相關概念和技術。
2. 用實際案例為使用者介紹Hadoop,而不只是在理論層面。
3. 詳解Hadoop 相關領域最新的技術和商業應用大數據應用的動態變化。
本書並非以教科書式概念作為架構,而是藉由一些真實可靠的案例範示呈現,說解在各種場景下如何應用Hadoop。本書能幫助讀者開闊眼界和找到方法,知道如何分析實際商業場景及業務問題,構建基於Hadoop大數據系統,透過使用數據管理及運用,對公司業務經營帶來直接效益。當然對於學生、教師和有志於從業大數據處理、分析與應用的人員來說,也是一本實用教材。
本書特色
◆ 好用、可靠、可擴充的大規模資料儲存和分析系統
◆ 結合Spark高效且快速進行巨量數據處理
◆ 分散式系統容錯率高,當軟硬體出錯後系統都能繼續執行
目錄大綱
01 大數據概念的老調重彈
1.1 網際網路和物聯網上的資料
1.2 資料能為我們做的事
1.3 資料採擷中的一些基本概念
1.4 資料倉儲
1.5 不包含在本書中的內容
1.6 這本書都講些什麼
02 Hadoop的前世今生
2.1 Google的計算架構
2.2 Hadoop的誕生
2.3 Hadoop的今天
2.4 Hadoop大事記
03 等於大數據的Hadoop
3.1 Hadoop理念
3.2 Hadoop核心基礎架構
3.3 Hadoop上的各種其他元件
3.4 Spark和Hadoop
04 Hadoop的價值
4.1 大數據時代需要新的架構
4.2 Hadoop能解決的問題
4.3 去IOE
4.4 7種最常見的Hadoop和Spark專案
05 Hadoop系統速成
5.1 Hadoop系統架設速成
5.2 在雲端上執行Hadoop
5.3 Hadoop資訊大全
06 資料倉儲和Hadoop
6.1 大數據時代的資料系統設計
6.2 傳統資料倉儲的瓶頸
6.3 Hadoop是解決資料倉儲瓶頸的方法
6.4 以Hadoop和Spark為基礎的資料倉儲解決方案
07 在不同應用環境下的Hadoop
7.1 在儲存密集型環境中的Hadoop
7.2 在網路密集型環境中的Hadoop
7.3 在運算密集型環境中的Hadoop
7.4 Hadoop平台的比較和選擇
08 Hadoop在網際網路公司的應用
8.1 Hadoop在騰訊
8.2 Hadoop在Facebook的應用
8.3 金山的Hadoop
8.4 迅雷公司對Hadoop的應用
09 Hadoop和企業應用之一
9.1 Hadoop和電信業者
9.2 Hadoop和公用事業
9.3 Hadoop和「智慧工商」
9.4 Hadoop和政務雲
10 Hadoop與「衣食住行」中的「食」和「行」
10.1 Hadoop和「食」
10.2 Hadoop和「行」
11 Hadoop和企業應用之三
11.1 Hadoop和金融
11.2 Hadoop和醫療
11.3 Hadoop和物流
11.4 Hadoop和媒體
12 特殊場景下的Hadoop系統
12.1 Hadoop和即時系統
12.2 Hadoop平台的一些特殊場景實現
13 Hadoop系統的挑戰和應對
13.1 Hadoop系統使用須知
13.2 Hadoop平台風險點預估
13.3 Hadoop平台硬體故障的應對機制
13.4 Hadoop平台如何真正做到高可用性
13.5 Hadoop平台安全性和隱私性的應對機制
14 Hadoop的未來
14.1 Hadoop未來的發展趨勢
14.2 Hadoop和區塊鏈
A 專業詞彙表
B 參考文獻
C 參考網站一覽
D HDFS 命令列列表
作者介紹
譚磊
復旦大學電腦學士,美國杜克大學電腦碩士,NABA北美區塊鏈協會聯合創始人。在美國微軟服務超過13年,在搜索、互聯網廣告、資料採擷、電子商務等方面有豐富的經驗,是互聯網技術領域資深專家。
范磊
前英特爾亞太區大數據總監,知名大數據專家,星環科技聯合創始人兼CEO。