雲計算大數據處理
內容描述
本書介紹了基於雲計算的大數據處理技術,重點介紹了一款高效的、實時分析處理海量數據的強有力工具―數據立方。數據立方是針對大數據處理的分布式數據庫,能夠可靠地對大數據進行實時處理,具有即時響應多用戶併發請求的能力。
本書通過對當前主流的大數據處理系統進行深入剖析,闡述了數據立方產生的背景,介紹了數據立方的整體架構以及安裝和詳細開發流程,並給出了4個完整的數據立方綜合應用實例。所有實例都經過驗證並附有詳細的步驟說明,無論是對於雲計算的初學者還是想進一步深入學習大數據處理技術的研究和開發人員都有很好的參考價值。讀者也可從本書配套網站中國雲計算和中國大數據獲取更多資料或求解疑難問題。
目錄大綱
第1章大數據挑戰
1.1當前面臨的大數據挑戰
1.1.1大數據急劇膨脹
1.1.2大數據智能分析
1.1.3大數據深度挖掘
1.1.4業務與技術脫節
1.2大數據催生雲計算
1.2.1雲計算不是偶然
1.2.2雲計算帶來挑戰與機遇
1.2.3雲計算對大數據的意義
1.2.4雲計算的未來展望
1.3大數據存儲
1.3.1存儲僅是步
1.3.2行存儲和列存儲
1.3.3 PB級大數據存儲
1.3.4大數據存儲的未來
1.4大數據處理
1.4.1大數據處理的瓶頸
1.4.2大數據處理的需求
1.4.3大數據處理技術決定未來
1.4.4大數據處理解決方案
參考文獻
第2章當前的大數據處理系統
2.1開源大數據處理平台
2.1.1 Hadoop
2.1.2 MapReduce
2.2 NoSQL數據庫
2.2.1 Google BigTable的開源Java實現:HBase
2.2.2純分佈式數據庫:Cassandra
2.2.3 NoSQL數據庫的應用場景
2.3數據倉庫平台
2.3.1 Hive
2.3.2數據倉庫平台架構
2.3.3數據倉庫平台的實現
參考文獻
第3章數據立方簡介
3.1數據立方的產生背景
3.2數據立方的相關技術
3.2.1雲計算中的大數據處理技術——MapReduce
3.2.2並行數據庫技術
3.2.3雲計算與數據庫相結合的技術
3.3數據立方的架構以及與Hadoop的關係
3.3.1數據立方的體系架構
3.3.2數據立方與Hadoop的關係
參考文獻
第4章數據立方及配套環境的安裝
4.1安裝流程
4.2操作系統的安裝
4.2 .1 CentOS 6.2的安裝
4.2.2 JDK的安裝
作者介紹
于全
中國工程院院士,中國電子系統設備工程公司研究員,西安電子科技大學、北京郵電大學兼職教授、博士生導師。1986年獲南京大學學士學位,1992年獲法國里摩日大學博士學位。長期承擔通信裝備的總體設計與科研任務,先後主持完成了代戰術通信網絡、 部軟件無線電台等20多項重大科研項目。主要研究方向為戰術通信網絡、認知無線電、移動互聯網等。曾獲科技進步一等獎1項、二等獎1項,部級科技進步一等獎4項,發明專利20餘項,出版專著4部,享受政府特殊津貼,榮立一等功1次、二等功2次,獲得中國青年五四獎章標兵、第九屆中國青年科技獎、全國科技工作者、中國科協求是傑出青年獎、何梁伺利基金科學與技術進步獎等榮譽。