大數據原理與實戰

大數據原理與實戰

作者: 趙渝強
出版社: 中國水利水電
出版在: 2022-01-01
ISBN-13: 9787522600116
ISBN-10: 7522600111
裝訂格式: 平裝
總頁數: 463 頁





內容描述


《大數據原理與實戰》一書覆蓋完整的大數據生態圈體系,包括 Hadoop 生態圈體系、
 Spark 生態圈體系、Flink 生態圈體系、 NoSQL 數據庫及相關組件。
本書側重動手實操,提供完整詳細的實驗步驟,可以讓讀者真實模擬大數據平台體系的運行環境,
在虛擬機上構建自己的大數據集群;同時,本書也兼顧必要的理論講解,
深入淺出,讓讀者在了解大數據基本架構和原理機制的基礎上,
能夠通過實驗真正掌握大數據平台體系中的技術組件。
  《大數據原理與實戰》適合具有一定 Java 編程基礎的人員閱讀,
如平台架構師、開發人員、運維管理人員等。
本書內容詳盡,不僅可以作為初學者的學習用書,
而且可以作為開發人員等工作中的參考手冊。


目錄大綱


目錄
第1章 大數據核心理論基礎與架構
1.1 大數據概述
1.1.1 大數據的基本概念和特性
1.1.2 大數據平台所要解決的核心問題
1.1.3 數據倉庫與大數據
1.2 大數據的理論基礎
1.2.1 Google文件系統
1.2.2 MapReduce分佈式計算模型
1.2.3 BigTable分佈式數據庫
1.3 大數據生態圈組件
1.3.1 Hadoop生態圈
1.3.2 Spark生態圈
1.3.3 Flink生態圈
1.4 基於大數據組件的平台架構
第2章 部署大數據環境
2.1 準備大數據平台環境
2.1.1 安裝Linux操作系統
2.1.2 配置Linux環境
2.2 部署Hadoop環境
2.2.1 Hadoop的目錄結構
2.2.2 部署Hadoop本地模式
2.2.3 部署Hadoop偽分佈模式
2.2.4 部署Hadoop全分佈模式
2.3 部署 Spark環境
2.3.1 部署Spark偽分佈模式
2.3.2 部署Spark全分佈模式
2.4 部署Flink環境
2.4.1 部署Flink偽分佈模式
2.4.2 部署Flink全分佈模式
2.5 大數據體系的單點故障問題
第3章 HDFS
3.1 HDFS體系架構詳解
3.1.1 NameNode
3.1.2 DataNode
3.1.3 SecondaryNameNode
3.2 使用不同方式操作HDFS
3.2.1 HDFS令令行
3.2.2 Java API
3.2.3 Web Console
3.3 HDFS的高級特性
3.3.1 回收站
3.3.2 快照
3.3.3 配額管理
3.3.4 安全模式
3.3.5 權限管理
3.4 聯盟
3.4.1 聯盟概述
3.4.2 聯盟的架構
3.4.3 部署聯盟
3.5 HDFS的底層通信方式RPC
3.5.1 RPC概述
3.5.2 開發服務器端程序和客戶端程庫
3.5.3 運行RPC服務器端程序和客戶端程序
……
第4章 NoSQL數據庫HBase
第5章 MapReduce編程
第6章 數據分析引擎Hive
第7章 數據分析引擎Pig
第8章 數據分析引擎Presto
第9章 大數據計算引擎Spark Core
第10章 數據分析引擎Spark SQL
第11章 流式計算引擎Spark Streaming
第12章 大數據計算引擎Flink基礎
第13章 大數據計算引擎Flink進階
第14章 分佈式協調服務ZooKeeper
第15章 大數據的ETL採集框




相關書籍

Go Systems Programming

作者 Mihalis Tsoukalos

2022-01-01

PHP MySQL 和 JavaScript 入門經典, 6/e (PHP, MySQL & JavaScript All in One, Sams Teach Yourself, 6/e)

作者 [美]朱莉·C·梅洛尼

2022-01-01

HTML5 + CSS3 王者歸來

作者 洪錦魁

2022-01-01