大數據導論

大數據導論

作者: 林子雨
出版社: 人民郵電
出版在: 2020-09-01
ISBN-13: 9787115544469
ISBN-10: 7115544468
總頁數: 268 頁





內容描述


本書詳細闡述了培養復合型大數據專業人才所需要的大數據相關知識。全書共9章,內容包括大數據概述、大數據與其他新興技術的關系、大數據基礎知識、大數據應用、數據採集與預處理、數據存儲與管理、數據處理與分析、數據可視化、大數據分析綜合案例。在大數據基礎知識部分,本書詳細介紹了與培養學生的數據素養相關的知識,包括大數據安全、大數據思維、大數據倫理、數據共享、數據開放和大數據交易。本書可以作為高等院校大數據專業的導論課教材,也可供相關技術人員參考。


目錄大綱


第1章 大數據概述 11.1 數據 11.1.1 數據的概念 11.1.2 數據類型 21.1.3 數據組織形式 21.1.4 數據的使用 31.1.5 數據的價值 41.1.6 數據爆炸 41.2 大數據時代 51.2.1 第三次信息化浪潮 51.2.2 信息科技為大數據時代提供技術支撐 51.2.3 數據產生方式的變革促成大數據時代的來臨 71.3 大數據的發展歷程 91.4 世界各國的大數據發展戰略 101.4.1 美國 111.4.2 英國 111.4.3 法國 111.4.4 韓國 121.4.5 日本 121.4.6 中國 121.5 大數據的概念 131.5.1 數據量大 131.5.2 數據類型繁多 141.5.3 處理速度快 151.5.4 價值密度低 161.6 大數據的影響 161.6.1 大數據對科學研究的影響 161.6.2 大數據對社會發展的影響 181.6.3 大數據對就業市場的影響 191.6.4 大數據對人才培養的影響 191.7 大數據的應用 201.8 大數據產業 221.9 高校大數據專業 231.9.1 大數據專業的人才培養目標 241.9.2 畢業生就業崗位 241.9.3 大數據專業知識體系 251.9.4 大數據專業課程體系 251.9.5 大數據專業的編程語言 261.10 本章小結 281.11 習題 29第2章 大數據與其他新興技術的關系 302.1 雲計算 302.1.1 雲計算的概念 302.1.2 雲計算的服務模式和類型 332.1.3 雲計算數據中心 342.1.4 雲計算的應用 352.1.5 雲計算產業 352.2 物聯網 362.2.1 物聯網的概念 362.2.2 物聯網的關鍵技術 372.2.3 物聯網的應用 392.2.4 物聯網產業 402.3 大數據與雲計算、物聯網的關系 402.4 大數據與人工智能 412.4.1 人工智能的概念 422.4.2 人工智能的關鍵技術 422.4.3 人工智能的應用 472.4.4 人工智能產業 512.4.5 大數據與人工智能的關系 542.5 大數據與區塊鏈 552.5.1 從比特幣說起 552.5.2 區塊鏈的原理 562.5.3 區塊鏈的定義 612.5.4 區塊鏈的應用 612.5.5 大數據與區塊鏈的關系 632.6 本章小結 642.7 習題 64第3章 大數據基礎知識 663.1 大數據安全 663.1.1 傳統數據安全 673.1.2 大數據安全與傳統數據安全的不同 673.1.3 大數據安全問題 683.1.4 典型案例 713.2 大數據思維 743.2.1 傳統的思維方式 753.2.2 大數據時代需要新的思維方式 753.2.3 大數據思維方式 763.2.4 運用大數據思維的具體實例 803.3 大數據倫理 873.3.1 大數據倫理的概念 873.3.2 大數據倫理典型案例 883.3.3 大數據的倫理問題 903.4 數據共享 943.4.1 數據孤島問題 953.4.2 數據孤島問題產生的原因 963.4.3 消除數據孤島的重要意義 963.4.4 實現數據共享所面臨的挑戰 973.4.5 推進數據共享開放的舉措 983.4.6 數據共享案例 1003.5 數據開放 1033.5.1 政府開放數據的理論基礎 1043.5.2 政府信息公開與政府數據開放的聯系與區別 1063.5.3 政府數據開放的重要意義 1073.6 大數據交易 1093.6.1 大數據交易概述 1093.6.2 大數據交易發展現狀 1103.6.3 大數據交易平臺 1113.7 本章小結 1153.8 習題 115第4章 大數據應用 1174.1 大數據在互聯網領域的應用 1174.1.1 什麽是推薦系統 1174.1.2 長尾理論 1184.1.3 推薦方法 1194.1.4 推薦系統模型 1194.1.5 推薦系統的應用 1204.2 大數據在生物醫學領域的應用 1214.2.1 流行病預測 1214.2.2 智慧醫療 1234.2.3 生物信息學 1244.2.4 案例:基於大數據的綜合健康服務平臺 1254.3 大數據在物流領域的應用 1294.3.1 智能物流的概念 1294.3.2 智能物流的作用 1304.3.3 智能物流的應用 1304.3.4 大數據是智能物流的關鍵 1304.3.5 中國智能物流骨乾網—菜鳥 1314.4 大數據在城市管理領域的應用 1344.4.1 智能交通 1344.4.2 環保監測 1354.4.3 城市規劃 1364.4.4 安防 1364.4.5 疫情防控 1374.5 大數據在金融領域的應用 1384.5.1 高頻交易 1384.5.2 市場情緒分析 1394.5.3 信貸風險分析 1394.5.4 大數據徵信 1404.6 大數據在汽車領域的應用 1424.7 大數據在零售領域的應用 1434.7.1 發現關聯購買行為 1434.7.2 客戶群體細分 1444.7.3 供應鏈管理 1454.8 大數據在餐飲領域的應用 1454.8.1 餐飲領域擁抱大數據 1454.8.2 餐飲O2O 1464.9 大數據在電信領域的應用 1474.10 大數據在能源領域的應用 1484.11 大數據在體育和娛樂領域的應用 1494.11.1 訓練球隊 1494.11.2 投拍影視作品 1504.11.3 預測比賽結果 1514.12 大數據在安全領域的應用 1524.12.1 大數據與國家安全 1524.12.2 應用大數據技術防禦網絡攻擊 1524.12.3 警察應用大數據工具預防犯罪 1534.13 大數據在政府領域的應用 1544.14 大數據在日常生活中的應用 1554.15 本章小結 1564.16 習題 157第5章 數據採集與預處理 1585.1 數據採集 1585.1.1 數據採集的概念 1585.1.2 數據採集的三大要點 1595.1.3 數據採集的數據源 1595.1.4 數據採集方法 1605.1.5 網絡爬蟲 1625.2 數據清洗 1665.2.1 數據清洗的內容 1675.2.2 數據清洗的註意事項 1685.3 數據轉換 1685.3.1 數據轉換策略 1685.3.2 平滑處理 1695.3.3 規範化處理 1715.4 數據脫敏 1725.4.1 數據脫敏原則 1725.4.2 數據脫敏方法 1735.5 本章小結 1735.6 習題 173第6章 數據存儲與管理 1756.1 傳統的數據存儲與管理技術 1756.1.1 文件系統 1756.1.2 關系數據庫 1756.1.3 數據倉庫 1776.1.4 並行數據庫 1786.2 大數據時代的數據存儲與管理技術 1796.2.1 分佈式文件系統 1796.2.2 NewSQL和NoSQL數據庫 1796.2.3 雲數據庫 1816.3 大數據處理架構Hadoop 1826.3.1 Hadoop特性 1826.3.2 Hadoop生態系統 1836.4 分佈式文件系統HDFS 1856.4.1 HDFS的設計目標 1866.4.2 HDFS體系結構 1876.5 NoSQL數據庫 1876.5.1 鍵值數據庫 1886.5.2 列族數據庫 1896.5.3 文檔數據庫 1906.5.4 圖數據庫 1906.6 雲數據庫 1916.6.1 雲數據庫的概念 1916.6.2 雲數據庫的特性 1926.6.3 雲數據庫與其他數據庫的關系 1936.6.4 代表性雲數據庫產品 1946.7 分佈式數據庫HBase 1946.7.1 從Bigtable說起 1956.7.2 HBase簡介 1956.7.3 HBase數據模型 1966.7.4 HBase系統架構 1976.8 Google Spanner 1986.9 本章小結 1996.10 習題 199第7章 數據處理與分析 2017.1 數據處理與分析的概念 2017.1.1 數據分析與數據挖掘 2017.1.2 數據分析與數據處理 2027.1.3 大數據處理與分析 2027.2 機器學習和數據挖掘算法 2037.2.1 概述 2037.2.2 分類 2047.2.3 聚類 2047.2.4 回歸分析 2057.2.5 關聯規則 2067.2.6 協同過濾 2067.3 大數據處理與分析技術 2077.3.1 技術分類 2077.3.2 流計算 2097.3.3 圖計算 2117.4 大數據處理與分析代表性產品 2127.4.1 分佈式計算框架MapReduce 2137.4.2 數據倉庫Hive 2147.4.3 數據倉庫Impala 2167.4.4 基於內存的分佈式計算框架Spark 2167.4.5 機器學習框架TensorFlowOnSpark 2327.4.6 流計算框架Storm 2337.4.7 流計算框架Flink 2357.4.8 大數據編程框架Beam 2377.4.9 查詢分析系統Dremel 2397.5 本章小結 2407.6 習題 240第8章 數據可視化 2428.1 可視化概述 2428.1.1 什麽是數據可視化 2428.1.2 可視化的發展歷程 2438.1.3 可視化的重要作用 2438.2 可視化圖表 2458.3 可視化工具 2468.3.1 入門級工具 2468.3.2 信息圖表工具 2468.3.3 地圖工具 2488.3.4 時間線工具 2498.3.5 高級分析工具 2508.4 可視化典型案例 2508.4.1 全球黑客活動 2508.4.2 互聯網地圖 2518.4.3 編程語言之間的影響力關系圖 2528.4.4 世界國家健康與財富之間的關系 2528.4.5 3D可視化互聯網地圖App 2538.5 本章小結 2538.6 習題 254第9章 大數據分析綜合案例 2559.1 案例任務 2559.2 系統設計 2569.2.1 系統總體設計 2569.2.2 數據庫設計 2569.2.3 系統網站設計 2579.2.4 算法設計 2589.3 技術選擇 2619.4 系統實現 2629.5 案例所需知識和技能 2639.6 本章小結 2639.7 習題 263參考文獻 264


作者介紹


林子雨(1978-),男,博士,国内高校知名大数据教师,厦门大学计算机科学系副教授,厦门大学云计算与大数据研究中心创始成员,厦门大学数据库实验室负责人,中国计算机学会数据库专委会委员,中国计算机学会信息系统专委会委员,中国高校首个“数字教师”提出者和建设者。2013年开始在厦门大学开设大数据课程,建设了国内高校首个大数据课程公共服务平台,平台累计网络访问量超过1000万次,成为全国高校大数据教学知名品牌,并荣获“2018年福建省教学成果二等奖”,主持的课程《大数据技术原理与应用》获评“2018年国家精品在线开放课程”。主讲课程:《大数据技术原理与应用》《大数据处理技术》《大数据导论》。个人主页:http://dblab.xmu.edu.cn/post/linziyu。E-mail: ziyulin@xmu.edu.cn。数据库实验室网站:http://dblab.xmu.edu.cn。建设了高校大数据课程公共服务平台(http://dblab.xmu.edu.cn/post/bigdata-teaching- platform/),为教师教学和学生学习大数据课程提供包括教学大纲、讲义PPT、学习指南、备课指南、实验指南、上机习题、授课视频、技术资料等全方位、一站式免费服务,平台每年访问量超过200万次,累计访问量超过750万次,同时提供面向高校的大数据实验平台建设方案和大数据课程师资培训服务。




相關書籍

雲端深入你我身邊:新一代邊緣運算技術直達

作者 張駿主編 祝鯤業 陸科進 問治國 周超 劉敬 吳敏

2020-09-01

PHP+MySQLWeb應用開發

作者 趙增敏 李彥明

2020-09-01

Ruby Cookbook 錦囊妙技 (Ruby Cookbook)

作者 Lucas Carlson Leonard Richardson 楊仁和 譯

2020-09-01