Keras 快速上手:基於 Python 的深度學習實戰
內容描述
《Keras快速上手:基於Python的深度學習實戰》系統地講解了深度學習的基本知識、建模過程和應用,並以深度學習在推薦系統、圖像識別、自然語言處理、文字生成和時間序列中的具體應用為案例,詳細介紹了從工具準備、數據獲取和處理到針對問題進行建模的整個過程和實踐經驗,是一本非常好的深度學習入門書。
不同於許多講解深度學習的書籍,《Keras快速上手:基於Python的深度學習實戰》以實用為導向,選擇了Keras 作為編程框架,強調簡單、快速地設計模型,而不去糾纏底層代碼,使得內容相當易於理解,讀者可以在CNTK、 TensorFlow 和Theano 的後台之間隨意切換,非常靈活。並且本書能幫助讀者從高度抽象的角度去審視業務問題,達到事半功倍的效果。
《Keras快速上手:基於Python的深度學習實戰》從如何準備深度學習的環境開始,手把手地教讀者如何採集數據,如何運用一些最常用,也是目前被認為最有效的一些深度學習算法來解決實際問題。覆蓋的領域包括推薦系統、圖像識別、自然語言情感分析、文字生成、時間序列、智能物聯網等。不同於許多同類的書籍,《Keras快速上手:基於Python的深度學習實戰》選擇了Keras作為編程軟件,強調簡單、快速的模型設計,而不去糾纏底層代碼,使得內容相當易於理解。讀者可以在CNTK、TensorFlow和Theano的後台之間隨意切換,非常靈活。即使你有朝一日需要用更低層的建模環境來解決更複雜的問題,相信也會保留從Keras中學來的高度抽象的角度審視你要解決的問題,讓你事半功倍。
《Keras快速上手:基於Python的深度學習實戰》以實際應用為導向,強調概念的認知和實用性,對理論的介紹深入淺出,對讀者的數學水平要求較低,讀者在學習完畢後能使用案例程序舉一反三地應用到其具體場景中。《Keras快速上手:基於Python的深度學習實戰》覆蓋當前最熱門的傳統數據挖掘場景和四個深度學習應用場景,根據我們市場調研,是目前獨一一本以應用為導向的介紹機器學習和深度學習的專業書籍,具備很高的參考價值和學術價值。
目錄大綱
1準備深度學習的環境1
1.1硬件環境的搭建和配置選擇1
1.1.1通用圖形處理單元3
1.1.2你需要什麼樣的GPU加速卡6
1.1.3你的GPU需要多少內存6
1.1.4是否應該用多個GPU 10
1.2安裝軟件環境12
1.2.1所需軟件列表12
1.2.2 CUDA的安裝13
1.2.3 Python計算環境的安裝13
1.2.4深度學習建模環境介紹15
1.2.5安裝CNTK及對應的Keras 17
1.2.6安裝Theano計算環境23
1.2.7安裝TensorFlow計算環境25
1.2.8安裝cuDNN和CNMeM 27
2數據收集與處理28
2.1網絡爬蟲28
2.1.1網絡爬蟲技術29
2.1.2構造自己的Scrapy爬蟲30
2.1.3構造可接受參數的Scrapy爬蟲35
2.1.4運行Scrapy爬蟲36
2.1.5運行Scrapy爬蟲的一些要點38
2.2大規模非結構化數據的存儲和分析40
2.2.1 ElasticSearch介紹42
2.2.2 ElasticSearch應用實例44
3深度學習簡介57
3.1概述57
3.2深度學習的統計學入門58
3.3一些基本概念的解釋61
3.3.1深度學習中的函數類型62
3.3. 2深度學習中的其他常見概念65
3.4梯度遞減算法67
3.5後向傳播算法70
4 Keras入門72
4.1 Keras簡介72
4.2 Keras中的數據處理73
4.2.1文字預處理74
4.2.2序列數據預處理82
4.2.3圖片數據輸入83
4.3 Keras中的模型83
4.4 Keras中的重要對象86
4.5 Keras中的網絡層構造90
4.6使用Keras進行奇異值矩陣分解102
5推薦系統105
5.1推薦系統簡介105
5.2矩陣分解模型108
5.3深度神經網絡模型114
5.4其他常用算法117
5.5評判模型指標119
6圖像識別121
6.1圖像識別入門121
6.2卷積神經網絡的介紹122
6.3端到端的MNIST訓練數字識別127
6.4利用VGG16網絡進行字體識別131
6.5總結135
7自然語言情感分析136
7.1自然語言情感分析簡介136
7.2文字情感分析建模139
7.2.1詞嵌入技術139
7.2.2多層全連接神經網絡訓練情感分析140
7.2.3卷積神經網絡訓練情感分析143
7.2.4循環神經網絡訓練情感分析144
7.3總結146
8 字生成147
8.1文字生成和聊天機器人147
8.2基於檢索的對話系統148
8.3基於深度學習的檢索式對話系統159
8.3.1對話數據的構造159
8.3.2構造深度學習索引模型162
8.4基於文字生成的對話系統166
8.5總結172
9時間序列173
9.1時間序列簡介173
9.2基本概念174
9.3時間序列模型預測準確度的衡量178
9.4時間序列數據示例179
9.5簡要回顧ARIMA時間序列模型181
9.6循環神經網絡與時間序列模型186
9.7應用案例188
9.7.1長江漢口月度流量時間序列模型190
9.7.2國際航空月度乘客數時間序列模型203
9.8總結209
10智能物聯網210
10.1 Azure和IoT 210
10.2 Azure IoT Hub服務213
10.3使用IoT Hub管理設備概述215
10.4使用.NET將模擬設備連接到IoT中心218
10.5機器學習應用實例237
作者介紹
謝梁
現任微軟雲計算核心存儲部門首席數據科學家,主持運用機器學習和人工智能方法優化大規模高可用性並行存儲系統的運行效率和改進其運維方式。具有十餘年機器學習應用經驗,熟悉各種業務場景下機器學習和數據挖掘產品的需求分析、架構設計、算法開發和集成部署,涉及金融、能源和高科技等領域。曾經擔任美國道瓊斯工業平均指數獨一保險業成分股的旅行家保險公司分析部門總監,負責運用現代統計學習方法優化精算定價業務和保險運營管理,推動精準個性化定價解決方案。在包括Journal of Statistical Software等專業期刊上發表過多篇論文,擔任Journal of Statistical Computation and Simulation期刊以及Data Mining Applications with R一書的審稿人。本科畢業於西南財經大學經濟學專業,博士畢業於紐約州立大學計量經濟學專業。
魯穎
現任谷歌矽谷總部數據科學家,為谷歌應用商城提供核心數據決策分析,利用機器學習和深度學習技術建立用戶行為預測模型,為產品優化提供核心數據支持。曾在亞馬遜、微軟和迪士尼美國總部擔任機器學習研究科學家,有著多年使用機器學習和深度學習算法研發為業務提供解決方案的經驗。熱衷於幫助中國社區的人工智能方面的研究和落地,活躍於各個大型會議並發表主題演講。本科畢業於復旦大學數學專業,博士畢業於明尼蘇達大學統計專業。
勞虹嵐
現任微軟研究院研究工程師,是早期智能硬件項目上視覺和語音研發的核心團隊成員,對企業用戶和消費者需求體驗與AI技術的結合有深刻的理解和豐富的經驗。曾在Azure和Office 365負責處理大流量高並發的後台雲端研究和開發,精通一系列系統架構設計和性能優化方面的解決方案。擁有從前端到後端的豐富經驗:包括客戶需求判斷、產品開發以及最終在雲端架構設計和部署。本科畢業於浙江大學電子系,碩士畢業於美國南加州大學(USC)電子和計算機系。