數據分析與可視化(基於AWS雲平臺)(微課版)
內容描述
本書較為全面地介紹了在AWS雲平臺上進行數據分析和可視化開發必備的知識和技能。全書包含6個項目,分別介紹了搭建AWS數據分析開發環境、在數據分析中使用Amazon S3存儲桶、使用Flask框架設計網站並進行數據分析、在Notebook中進行數據分析及可視化、Web應用程序的數據可視化和航空數據分析及可視化。每個項目之後還提供了課後練習,幫助讀者鞏固所學的內容。本書可以作為高職高專軟件技術相關專業和非電腦專業雲計算開發課程的教材,也可以作為電腦軟件、硬件培訓班教材,還可供數據分析開發人員、數據可視化開發人員和廣大電腦愛好者閱讀參考。
目錄大綱
項目一 搭建AWS數據分析開發環境 11.1 情境描述 11.2 任務分析 11.3 雲計算及AWS基礎 21.3.1 雲計算概述 21.3.2 雲計算的類型 31.3.3 AWS概述 41.3.4 AWS雲平臺概述 61.3.5 Jupyter Notebook簡介 101.4 安裝並配置AWS數據分析及可視化開發環境 111.4.1 登錄AWS中國區管理控制台 111.4.2 創建並配置Amazon EC2實例 131.4.3 使用SSH客戶端遠程登錄Amazon EC2實例 171.4.4 安裝Notebook開發環境 181.4.5 使用Notebook完成函數曲線的可視化 231.4.6 使用conda安裝包 251.4.7 為Amazon EC2實例創建更多用戶 301.5 課後練習 31項目二 在數據分析中使用Amazon S3存儲桶 332.1 情境描述 332.2 任務分析 332.3 Amazon S3存儲桶基礎 342.3.1 Amazon S3概述 342.3.2 Amazon S3的特點 342.3.3 Amazon S3的核心概念和技術 342.3.4 Amazon S3的功能 352.4 通過AWS管理控制台使用Amazon S3存儲桶 362.4.1 創建存儲桶 372.4.2 向存儲桶中添加對象 402.4.3 從存儲桶中下載對象 442.4.4 在存儲桶中復制對象 452.4.5 刪除對象和清空存儲桶 472.4.6 刪除存儲桶 492.5 使用Python語言操作Amazon S3存儲桶對象 502.5.1 boto簡介 502.5.2 安裝並配置boto 502.5.3 創建可以匿名訪問的存儲桶 522.5.4 可視化Amazon S3存儲桶中的數據 572.5.5 在同一幅圖上繪制多條曲線 582.6 課後練習 60項目三 使用Flask框架設計網站並進行數據分析 613.1 情境描述 613.2 任務分析 613.3 Flask基礎 623.3.1 Flask的設計思路 623.3.2 Flask開發基礎 653.3.3 路由 663.3.4 靜態文件 693.3.5 渲染模板 703.4 配置並使用Flask開發基礎 713.4.1 配置Flask開發環境 713.4.2 使用Flask設計“hello world”頁面 743.4.3 在虛環境中使用Flask 763.5 班級成績錄入分析系統 783.5.1 建立工作文件夾和虛環境 783.5.2 添加應用工廠函數 793.5.3 操作SQLite數據庫 793.5.4 設計用戶賬戶管理功能 833.5.5 設計成績錄入分析功能 913.5.6 保存用戶登錄狀態功能及用戶註銷功能 943.5.7 設計成績分析功能 1033.6 課後練習 105項目四 在Notebook中進行數據分析及可視化 1074.1 情境描述 1074.2 任務分析 1074.3 pandas基礎 1074.3.1 pandas介紹 1074.3.2 pandas的Series對象 1084.3.3 pandas的DataFrame對象 1134.3.4 使用pandas的方法讀寫文件 1194.4 pyecharts基礎 1224.4.1 pyecharts簡介 1224.4.2 內置的圖表類型 1234.4.3 全局配置項 1234.4.4 系列配置項 1254.5 使用pyecharts內置圖表進行數據可視化 1274.5.1 將溫度數據用折線圖進行可視化 1274.5.2 將不同品牌銷售數據用餅圖進行可視化 1344.5.3 將文本的詞頻統計結果用詞雲圖進行可視化 1394.6 課後練習 146項目五 Web應用程序的數據可視化 1485.1 情境描述 1485.2 任務分析 1485.3 numpy基礎 1495.3.1 numpy簡介 1495.3.2 使用numpy數組對象 1495.3.3 使用numpy的方法讀寫文件 1635.4 ECharts基礎 1675.4.1 ECharts簡介 1675.4.2 ECharts中的名詞和概念 1685.4.3 ECharts中的樣式 1695.4.4 異步數據加載和更新 1705.4.5 ECharts中的事件和行為 1705.5 在Flask中使用ECharts進行數據可視化 1715.5.1 使用Flask設計可視化網站 1715.5.2 將考試成績用柱狀圖進行可視化 1725.5.3 將考試成績用餅圖進行可視化 1765.5.4 將考試成績用散點圖進行可視化 1825.6 課後練習 187項目六 航空數據分析及可視化 1916.1 情境描述 1916.2 任務分析 1916.3 數據分析技術基礎 1926.3.1 數據分析技術簡介 1926.3.2 數據分析常用的數據文件格式 1926.3.3 數據分析技術中常用的統計量 1936.4 在Notebook中開發航空數據分析及可視化程序 1956.4.1 從存儲在Amazon S3存儲桶中的ZIP文件中讀取航班數據 1956.4.2 分析並可視化一段時間內進出港最繁忙的機場 2006.4.3 統計並可視化一段時間內若乾國家的航班 2116.4.4 分析並可視化我國城市航班排名 2176.5 課後練習 222
作者介紹
薛国伟,高级工程师,博士后。在哈尔滨工业大学获得学士、硕士、博士学位。深圳市后备级领军人才、深圳市科创委项目评审专家、深圳技师学院通信网络应用专业顾问委员会委员、深圳信息职业技术学院软件学院骨干教师。从事软件技术、大数据处理和人工智能方面的研究和教育工作,发表学术论文7篇,获授权发明专利2项,出版“十三五”职业教育国家规划教材一部。