敏捷數據分析工具箱 — 深入解析 ADW + OAC
內容描述
本書從數據倉庫的方法論入手,為讀者系統而又全面地介紹敏捷數據分析的相關工具:ADW、OAC,內容涵蓋Oracle ADW的技術特徵、數據加載及應用開發等部分;在OAC方面,深入地介紹了OAC的技術與強大的功能,同時也加入了諸多的高級主題。另外,本書的第4部分介紹了其他相關知識。本書內容在保證深度的基礎上兼顧了技術的廣度,並結合了大量實戰性操作和案例,使讀者可以在較短的時間內全面瞭解敏捷數據分析的相關知識。希望本書可以拋磚引玉,讓更多的人關註ADW和增強分析技術。
目錄大綱
第1部分數據倉庫管理篇
第1章數據倉庫的概念、興起及其構建方222
1.1數據倉庫的概念與發展歷程簡述2
1.2雲計算與大數據背景下的數據倉庫技術4
1.3數據倉庫構建方224
1.3.1傳統的數據倉庫構建方法5
1.3.2敏捷數據集市構建方法6
1.3.3 Oracle推薦的數據倉庫構建方法8
1.4本章小結10
第2章自治數據庫(ADW)技術特徵11
2.1 ADW簡介11
2.2 ADW實例的創建與連接15
2.2.1 ADW實例的申請15
2.2.2使用SQL Developer連接到ADW實例18
2.3 ADW實例的管理與監控21
2.3.1一般信息、標記與度量21
2.3.2性能中心24
2.3.3服務控制台25
2.3.4縱向擴展/收縮30
2.3.5停止31
2.3.6操作31
2.4 ADW的技術特徵32
2.4.1 ADW的部分技術指標32
2.4.2初始化參數設置33
2.4.3內存分配35
2.4.4並行處理36
2.4.5 RESULT CACHE38
2.4.6資源管理與並發管理39
2.4.7表空間與存儲限制41
2.4.8手動備份43
2.4.9自動縮放49
2.4.10對機器學習算法的支持49
2.4.11數據庫特性方面的一些限制51
2.4.12 SQL語句方面的一些限制51
2.4.13數據類型方面的一些限制52
2.5本章小結53
第3章數據加載54
3.1加載文本54
3.2使用Oracle對象存儲將數據加載到ADW中59
3.3 dump文件加載65
3.4使用Kettle進行數據加載66
3.4.1相關軟件的下載與安裝66
3.4.2將數據加載到ADW中70
3.5本章小結75
第2部分數據倉庫開發篇
第4章Oracle APEX開發77
4.1 Oracle APEX簡介77
4.1.1 Oracle APEX的特點78
4.1.2 Oracle APEX適用場景79
4.1.3 Oracle APEX架構79
4.1.4 Oracle APEX組件81
4.2數據加載87
4.3創建數據庫應用95
4.4在頁設計器中管理頁面103
4.5為APEX應用增加安全性110
4.6用戶權限管理115
4.7 APEX應用開發的環境遷移118
4.8 APEX相關資源121
4.9本章小結121
第5章Oracle ML SQL Notebook122
5.1 Oracle ML SQL Notebook簡介122
5.1 .1創建Oracle ML SQL Notebook開髮用戶123
5.1.2 Oracle ML功能介紹125
5.2 Oracle ML設置126
5.2.1創建記事本126
5.2.2記事本全局設置127
5.2.3 SQL語句型段落設置129
5.3分類模型131
5.3.1分類算法概述132
5.3.2構建分類模型133
5.4關聯規則146
5.4.1關聯規則概述146
5.4.2構建關聯規則模型146
5.5本章小結155
第3部分增強分析技術與應用篇
第6章OAC技術與功能157
6.1增強分析157
6.2 OAC簡介158
6.3 OAC實例的創建與登錄160
6.4 OAC功能概述162
6.5連接到數據源167
6.6數據準備與處理173
6.7數據分析畫布與敘述179
6.8共享與協作185
6.9地圖與插件管理187
6.10企業級分析功能概述190
6.11快照與遷移197
6.12移動端工具198
6.13 OAD200
6.14本章小結200
第7章使用OAC進行數據分析201
7.1一鍵解釋201
7.2英文、中文分詞處理202
7.2.1英文分詞處理203
7.2.2中文分詞處理207
7.3在OAD中使用jieba包進行中文分詞210
7.4數據流的機器學習219
7.5面向餐飲行業的數據分析樣例228
7.6本章小結2 46
第4部分其他相關知識篇
第8章Oracle公有云架構248
8.1 Oracle公有云服務分類248
8.2 Oracle公有云重點服務介紹253
8.2.1 Oracle管理雲服務253
8.2.2 Oracle區塊鏈平台服務(OBP)254
8.2.3 Oracle數據科學云服務258
8.3本章小結260
第9章Oracle 19c關鍵特性261
9.1實時統計信息收集261
9.2 hint使用情況報告266
9.2.1 Oracle 19c中引入hint使用情況報告的目的266
9.2.2 hint使用情況報告的用戶接口267
9.2.3相關材料269
9.2.4 hint使用情況報告樣例270
9.3自動索引272
9.3.1自動索引簡介273
9.3.2自動索引是如何工作的273
9.3.3如何配置自動索引274
9.3.4生成自動索引使用情況報告277
9.3.5與自動索引相關的視圖279
9.3. 6自動索引示例280
9.4 SQL語句隔離(SQL Quarantine)284
9.4.1 SQL執行計劃隔離簡介285
9.4.2為SQL語句的執行計劃創建隔離配置287
9.4.3在隔離配置中設置隔離閾值288
9.4.4隔離配置的啟用/禁用290
9.4.5查看隔離配置的詳細信息291
9.4.6刪除隔離配置292
9.4.7查看某SQL語句被隔離的執行計劃的詳細信息292
9.4.8在數據庫之間轉移隔離配置293
9.4 .9對消耗過多系統資源的SQL語句的執行計劃進行隔離294
9.5混合分區表(Hybrid Partitioned Tables)299
9.5.1混合分區表簡介299
9.5.2混合分區表支持的操作301
9.5.3混合分區表的限制302
9.5.4創建混合分區表303
9.6其他新特性305
9.7本章小結306
參考文獻307
作者介紹
2006年畢業於吉林大學計算機學院;2006-2013年,先後為天津電力、聯想北京研發中心、建行北京數據中心等多家單位提供技術支持服務;2013-2018年,先後考取PMP ,以及Oracle 10g/11g OCM認證,與多家培訓機構合作,講授數據庫、大數據,以及雲計算方向的課程。2017-2018年,成為華為大數據和阿里雲大數據官方認證講師;2018年底至今,就職於甲骨文(中國),任職高級售前技術顧問。自2016年開始,先後出版、翻譯多本著作。