網絡安全大數據分析與實戰
內容描述
《網絡安全大數據分析與實戰》深入淺出地介紹了大數據安全分析的理論和實踐基礎,
涵蓋大數據安全概述、機器學習、深度學習、開發編程工具以及相關法律法規等內容,
簡明扼要地介紹了聚類分析、關聯分析、預測分析及分類所涉及的主流算法,
並以實戰導向的綜合案例對大數據安全分析的相關知識和技術進行了整合應用。
《網絡安全大數據分析與實戰》可以作為高校大數據安全分析相關專業課程的教材,
也可作為從事信息安全諮詢服務、測評認證、安全建設、
安全管理工作的從業人員及其他大數據安全分析相關領域工作人員的技術參考書。
目錄大綱
前言
第1章 大數據安全概述
1.1 大數據相關理論
1.1.1 大數據產生的背景
1.1.2 大數據的定義與構成
1.1.3 大數據的特徵與價值
1.2 大數據相關技術
1.2.1 大數據平台與架構
1.2.2 大數據分析常用工具
1.3 大數據應用案例
1.3.1 社交網絡廣告投放系統
1.3.2 圍棋智能AlphaGo
1.3.3 圖像識別
1.4 大數據分析技術在安全中的應用
1.4.1 安全需要大數據
1.4.2 安全大數據分析技術基礎及分析思路
本章小結
課後習題
第2章 大數據安全分析基礎
2.1 大數據分析理論基礎
2.1.1 基本概念
2.1.2 分析思路
2.1.3 分析算法
2.1.4 常見安全應用場景的特徵及檢測方法
2.2 大數據分析實踐基礎
2.2.1 編程工具
2.2.2 編程環境
2.2.3 Python基礎知識
本章小結
課後習題
第3章 大數據分析工程技術
3.1 數據採集
3.1.1 數據採集的概念
3.1.2 日誌採集工具Logstash
3.2 非結構化存儲
3.2.1 HDFS的基本信息
3.2.2 HDFS常用命令
3.2.3 HDFS管理命令
3.3 結構化存儲
3.3.1 HBase基本介紹
3.3.2 HBase中的基本概念
3.3.3 Hbase常用命令
3.4 數據搜索
3.4.1 Elasticsearch基本概念
3.4.2 副本複制機制
3.4.3 映射和分詞
3.4.4 映射管理
3.4.5 索引管理命令
3.4.6 搜索
3.4.7 聚合分析
3.5 實時計算引擎
3.5.1 基本概念
3.5.2 主流的大數據流計算引擎
3.5.3 Apache Flink
3.6 批量計算引擎
3.6.1 Apache Spark項目簡介
3.6.2 Spark核心模塊
3.6.3 Spark與Hadoop的區別
3.7 計算管理調度
3.7.1 任務管理調度中的挑戰
3.7.2 Airflow介紹
3.7.3 任務DAG與任務依賴
3.7.4 Airflow Hook
3.7.5 Airflow Operator
3.7.6 Airflow命令
3.8 數據可視化
3.8.1 明確表達意圖、選擇數據
3.8.2 拆解信息圖的要素
3.8.3 關於色彩、字體、圖標
3.8.4 可視化的交互考慮
3.8.5 人類視覺缺陷及對數據可視化的影響
3.8.6 數據可視化工具
3.8.7 數據可視化類庫
本章小結
課後習題
第4章 機器學習和深度學習
4.1 機器學習的基本概念
4.1.1 基本定義
4.1.2 應用場景
4.2 機器學習的算法分類
4.2.1 監督學習算法
4.2.2 無監督學習算法
4.2.3 特殊算法
4.3 深度學習基本理論
4.3.1 相關概念
4.3.2 深度學習的特點
4.4 深度學習的進展
4.4.1 AlphaGo戰胜李世石
4.4.2 圖像識別領域深度學習超越人類
4.4.3 目標識別領域深度學習推動無人駕駛的跨越式發展
4.5 深度學習核心思想
4.5.1 卷積神經網絡(CNN)
4.5.2 遞歸神經網絡(RNN)
4.5.3 長短期記憶網絡(LSTM)
本章小結
課後習題
第5章 分類算法
5.1 決策樹
5.1.1 基本概念
5.1.2 典型算法介紹
5.1.3 案例分析及算法優缺點
5.2 樸素貝葉斯算法
5.2.1 概念及原理
5.2.2 案例分析及算法優缺點
5.3 K近鄰(KNN)
5.3.1 基本概念及原理
5.3.2 案例分析及算法優缺點
5.4 支持向量機(SVM)算法
5.4.1 基本概念及原理
5.4.2 案例分析及算法優缺點
5.5 BP神經網絡
5.5.1 基本概念
5.5.2 算法原理
5.5.3 案例分析及算法優缺點
本章小結
課後習題
第6章 預測分析
6.1 統計預測
6.1.1 統計預測的概念及作用
6.1.2 統計預測方法的分類與選擇
6.1.3 統計預測的原則與步驟
6.2 時間序列分析
6.2.1 時間序列的概念
6.2.2 移動平均模型
6.2.3 指數平滑模型
6.2.4 隨機時間序列模型
6.3 回歸分析
6.3.1 回歸分析的原理
6.3.2 線性回歸
6.3.3 邏輯回歸
本章小結
課後習題
第7章 關聯分析
7.1 基本概念
7.1.1 項與項集
7.1.2 關聯規則及相關度量
7.2 Apriori算法
7.2.1 Apriori算法原理
7.2.2 Apriori算法示例
7.3 FP-Growth算法
7.3.1 FP-Growth算法原理
7.3.2 FP-Growth算法示例
7.4 關聯分析應用場景
本章小結
課後習題
第8章 聚類分析
8.1 聚類概述
8.1.1 基本概念
8.1.2 聚類分析的應用
8.2 相似度(距離)計算
8.2.1 歐氏距離
8.2.2 曼哈頓距離
8.2.3 閔可夫斯基距離
8.2.4 馬氏距離
8.2.5 夾角餘弦
8.3 層次聚類
8.3.1 基本概念及原理
8.3.2 案例分析
8.4 k-means聚類
8.4.1 基本概念及原理
8.4.2 案例分析
8.5 EM聚類
8.5.1 基本原理與概念
8.5.2 案例分析
本章小結
作者介紹
【作者簡介】
- 孫佳
獲浙江大學和馬里蘭大學信息管理本碩學位,現任安恆信息資深數據研究員。
對大數據挖掘、機器學習在信息安全領域的應用有深入研究,同時致力於大數據安全分析的教育工作。
曾擔任美國矽谷互聯網公司數據科學家,從事大數據建模、定量預測、產品優化等工作。 - 苗春雨
博士,杭州安恆信息高級副總裁。西安電子科技大學、中國科學技術大學等多所高校企業研究生導師,
擅長網絡安全防護體系、物聯網安全,發表各類學術論文50餘篇,專利和軟著20餘項,出版專著和教材6本。 - 劉博
杭州安恆信息首席科學家,美國馬里蘭大學計算機博士。
完成態勢感知、數據安全、隱私計算等領域300餘項技術發明專利。
主導和重點參與、省級重大科研項目9項。
擔任浙大安恆前沿研究中心副主任、大數據態勢感知國地研究中心副主任、之江實驗室網絡安全研究中心副主任等。