大數據導論
內容描述
這是一個大數據爆發的時代。面對信息的激流,多元化數據的涌現,大數據已經為個人生活、企業經營,甚至國家與社會的發展都帶來了機遇和挑戰,大數據已經成為IT信息產業中最具潛力的藍海。“大數據導論”是一門理論性和實踐性都很強的課程。本書是為高等職業院校大數據技術與應用專業“大數據導論”課程全新設計改編的,是一本具有豐富實踐特色的新形態教材。針對高等職業院校學生的發展需求,本書系統、全面地介紹了大數據技術與應用的基本知識和技能,詳細介紹了大數據與大數據時代、大數據時代思維變革、大數據促進行業發展、大數據方法的驅動力、大數據存儲技術、大數據處理技術、大數據分析技術、大數據在雲端等內容,具有較強的系統性、可讀性和實用性。
目錄大綱
項目1 大數據與大數據時代
任務1.1 進入大數據時代
【導讀案例】 準確預測地震
【任務描述】
【知識準備】 進入大數據時代
1.1.1 天文學——信息爆炸的起源
1.1.2 大數據的發展
1.1.3 重新認識數據
1.1.4 數據集與數據分析
【作 業】
【實訓操作】 ETI公司的背景信息
任務1.2 熟悉大數據的定義
【導讀案例】 得數據者得天下
【任務描述】
【知識準備】 定義大數據
1.2.1 大數據的定義
1.2.2 大數據的3V和5V特徵
1.2.3 廣義的大數據
1.2.4 大數據的結構類型
【作 業】
【實訓操作】 為ETI公司確定數據特徵與類型
項目2 大數據時代思維變革
任務2.1 理解思維轉變之一:樣本=總體
【導讀案例】 亞馬遜推薦系統
【任務描述】
【知識準備】 分析更多數據而不再是只依賴於隨機採樣
2.1.1 小數據時代的隨機採樣
2.1.2 大數據與喬布斯的癌症治療
2.1.3 全數據模式:樣本=總體
【作 業】
【實訓操作】 搜索與分析,體驗“樣本=總體”
任務2.2 理解思維轉變之二:接受數據的混雜性
【導讀案例】 數據驅動≠大數據
【任務描述】
【知識準備】 不再熱衷於追求精確度
2.2.1 允許不精確
2.2.2 大數據的簡單算法與小數據的復雜算法
2.2.3 紛繁的數據越多越好
2.2.4 混雜性是標準途徑
2.2.5 新的數據庫設計
2.2.6 5%的數字數據與95%的非結構化數據
【作 業】
【實訓操作】 搜索與分析,體驗“接受數據的混雜性”
任務2.3 理解思維轉變之三:數據的相關關系
【導讀案例】 美國百億美元望遠鏡主鏡安裝完畢
【任務描述】
【知識準備】 不再熱衷於尋找因果關系
2.3.1 關聯物,預測的關鍵
2.3.2 “是什麽”,而不是“為什麽”
2.3.3 通過因果關系瞭解世界
2.3.4 通過相關關系瞭解世界
【作 業】
【實訓操作】 搜索與分析,體驗“數據的相關關系”
項目3 大數據促進行業發展
任務3.1 理解大數據促進醫療與健康
【導讀案例】 大數據變革公共衛生
【任務描述】
【知識準備】 大數據促進醫療與健康
3.1.1 大數據促進循證醫學發展
3.1.2 大數據帶來醫療保健新突破
3.1.3 醫療信息數字化
3.1.4 超級大數據的最佳夥伴——搜索
3.1.5 數據決策的成功崛起
【作 業】
【實訓操作】 熟悉大數據在醫療健康領域的應用
任務3.2 理解大數據激發創造力
【導讀案例】 臉書的設計決策
【任務描述】
【知識準備】 大數據激發創造力
3.2.1 大數據幫助改善設計
3.2.2 大數據操作迴路
3.2.3 大數據資產的崛起
【作 業】
【實訓操作】 熟悉大數據如何激發創造力
項目4 大數據方法的驅動力
任務4.1 理解採用大數據的商業動機
【導讀案例】 大數據企業的縮影——谷歌(Google)
【任務描述】
【知識準備】 將數據變成競爭優勢
4.1.1 大數據的跨界年度
4.1.2 谷歌的大數據行動
4.1.3 亞馬遜的大數據行動
4.1.4 將信息變成一種競爭優勢
4.1.5 市場動態
4.1.6 業務架構
4.1.7 業務流程管理
【作 業】
【實訓操作】 理解採用大數據的商業動機
任務4.2 理解大數據規劃考慮
【導讀案例】 Google搜索算法告訴你,如何將一個人變成“傻瓜”
【任務描述】
【知識準備】 大數據的規劃考慮
4.2.1 信息與通信技術
4.2.2 萬物因特網
4.2.3 數據獲取與數據來源
4.2.4 不同的性能挑戰
4.2.5 不同的管理需求
【作 業】
【實訓操作】 ETI公司掌握大數據規劃方法
任務4.3 熟悉大數據商務智能
【導讀案例】 微信支付新廣告,講了一個支付之外的故事
【任務描述】
【知識準備】 大數據的商務智能
4.3.1 OLTP與OLAP
4.3.2 抽取、轉換和加載技術
4.3.3 數據倉庫與數據集市
4.3.4 傳統商務智能
4.3.5 大數據商務智能
4.3.6 大數據營銷
【作 業】
【實訓操作】 學習“五力模型”,熟悉大數據商務智能
項目5 大數據存儲技術
任務5.1 熟悉大數據存儲概念
【導讀案例】 2018未來交通峰會召開,高德地圖升級易行平臺
【任務描述】
【知識準備】 大數據存儲概念
5.1.1 數據清理
5.1.2 集群
5.1.3 文件系統和分佈式文件系統
5.1.4 分片與復制
5.1.5 CAP定理
5.1.6 ACID設計原則
5.1.7 BASE設計原理
【作 業】
【實訓操作】 熟悉大數據存儲的概念
任務5.2 瞭解大數據存儲技術
【導讀案例】 基礎領域突破非一日之功,是數十年的耕耘
【任務描述】
【知識準備】 大數據存儲技術
5.2.1 RDBMS數據庫
5.2.2 NoSQL數據庫
5.2.3 NewSQL數據庫
5.2.4 內存存儲設備
5.2.5 內存數據網格
5.2.6 內存數據庫
【作 業】
【實訓操作】 熟悉大數據存儲技術
項目6 大數據處理技術
任務6.1 熟悉大數據處理技術
【導讀案例】 Cloudera領銜大數據基礎設施
【任務描述】
【知識準備】 大數據技術架構及處理技術
6.1.1 開源技術的商業支援
6.1.2 大數據的技術架構
6.1.3 Hadoop數據處理基礎
6.1.4 處理工作量
6.1.5 批處理模式
6.1.6 SCV原則
6.1.7 實時處理模式
【作 業】
【實訓操作】 理解和熟悉大數據處理技術
項目7 大數據分析技術
任務7.1 瞭解大數據預測分析
【導讀案例】 葡萄酒的品質
【任務描述】
【知識準備】 大數據預測分析的內容與技術
7.1.1 什麽是預測分析
7.1.2 數據具有內在預測性
7.1.3 定量分析與定性分析
7.1.4 數據挖掘
7.1.5 統計分析
【作 業】
【實訓操作】 大數據準備度自我評分表
任務7.2 數據的內在預測性
【導讀案例】 Google AI:機器學習預測場景深度圖,模擬人眼更進一步
【任務描述】
【知識準備】 數據的內在預測能力
7.2.1 機器學習
7.2.2 語義分析
7.2.3 視覺分析
7.2.4 情感分析
7.2.5 人工神經網絡
【作 業】
【實訓操作】 熟悉ETI企業IT團隊採用的大數據分析技術
任務7.3 熟悉大數據分析的生命周期
【導讀案例】 百度大數據為新冠病毒社會影響“畫像”:解讀疫情發展,量化經濟擊,助力政府決策
導讀案例
【任務描述】
【知識準備】 大數據分析的生命周期
7.3.1 商業案例評估
7.3.2 數據標識
7.3.3 數據獲取與過濾
7.3.4 數據提取
7.3.5 數據驗證與清理
7.3.6 數據聚合與表示
7.3.7 數據分析
7.3.8 數據可視化
7.3.9 分析結果的使用
【作 業】
【實訓操作】 ETI企業所經歷的大數據分析生命周期
項目8 大數據在雲端
任務8.1 熟悉雲時代背景下的大數據
【導讀案例】 亞馬遜,數據在雲端
【任務描述】
【知識準備】 雲端大數據的基礎設施
8.1.1 雲端大數據
8.1.2 計算虛擬化
8.1.3 存儲虛擬化
8.1.4 網絡虛擬化
8.1.5 數據即服務
8.1.6 雲的挑戰
【作 業】
【實訓操作】 熟悉雲端大數據的基礎設施
任務8.2 把握大數據發展的未來
【導讀案例】 智能大數據分析成熱點
【任務描述】
【知識準備】 數據科學和大數據人才
8.2.1 數據科學
8.2.2 數據科學家與數據工作者
8.2.3 隱私權與安全性
8.2.4 連接開放數據
8.2.5 數據市場的興起
8.2.6 將原創數據變為增值數據
8.2.7 大數據未來展望
【作 業】
【實訓操作】 ETI企業的大數據之旅
【課程學習與實訓總結】
附錄A 課程作業參考答案
附錄B 課程學習能力測評
參考文獻