人人可懂的數據科學

人人可懂的數據科學

作者: (愛爾蘭)約翰·D. 凱萊赫(John D. Kelleher) (愛爾蘭)布倫丹·蒂爾尼(Brendan Tierney)
出版社: 機械工業
出版在: 2019-10-01
ISBN-13: 9787111637264
ISBN-10: 7111637267





內容描述


本書從數據科學發展演化史,數據科學定義,數據、數據集,數據科學生態系統,機器學習,數據科學標準任務,隱私與倫理,發展趨勢等角度,對數據科學展開了精彩的闡述。

本書精準界定了數據科學的術語、任務、生命周期,並介紹了主流的數據科學生態技術,及決策樹、回歸分析、神經網絡、深度學習等常見機器學習算法。同時也涵蓋隱私、數據倫理等方面的話題,介紹了數據科學可能引發的隱私泄露、人為歧視、不公平,以及歐盟、美國等國家或地區針對數據因素保護、數據倫理的立法。

數據科學是什麽?
數據科學是如何發展演化的?
數據科學項目的標準流程是什麽?
數據基礎設施面臨的挑戰有哪些?
數據科學與機器學習有什麽關系?
在數據科學過程中如何進行數據監管和保護個人隱私?
數據科學項目成功的重要原則是什麽?
數據科學的未來影響是什麽?

如今,數據科學推動了現代社會幾乎所有領域決策的發展,正在影響著人們日常生活的方方面面。本書旨在闡述理解數據科學所需的基本思想和概念,幫助你理解什麽是數據科學,它是如何工作的,以及它能(和不能)做什麽。


目錄大綱


譯者序
前言
致謝
作者簡介
 
第1章什麼是數據科學
1.1數據科學簡史
1.1.1數據收集簡史
1.1.2數據分析簡史
1.1.3數據科學的產生與發展
1.2數據科學用於何處
1.2.1銷售和營銷中的數據科學
1.2.2數據科學在政府中的應用
1.2.3數據科學在競技體育中的應用
1.3為什麼是現在
1.4關於數據科學的神話
 
第2章什麼是數據,什麼是數據集
2.1關於數據的觀點
2.2數據可以積累,而智慧不能
2.3 CRISP-DM
 
第3章數據科學生態系統
3.1將算法遷移至數據
3.1.1傳統數據庫與現代的傳統數據庫
3.1.2大數據架構
3.1.3混合數據庫世界
3.2數據準備和集成
 
第4章機器學習
4 .1有監督學習與無監督學習
4.2學習預測模型
4.2.1相關性不等同於因果,但它有時非常有用
4.2.2線性回歸
4.2.3神經網絡與深度學習
4 .2.4決策樹
4.3數據科學中的偏差
4.4評估模型:泛化而不是記憶
4.5摘要
 
第5章標準的數據科學任務
5.1誰是我們的目標客戶(聚類)
5.2這是欺詐嗎(異常值檢測)
5.3你要配份炸薯條嗎(關聯規則挖掘)
5.4流失還是不流失,這是一個問題(分類)
5.5它價值幾何(回歸)
 
第6章隱私與道德
6.1商業利益與個人隱私
6.1.1數據科學的道德啟示:畫像與歧視
6.1.2數據科學的道德含義:創建一個全景監獄
6.2隱私保護
6.2.1保護隱私的計算方法
6.2.2規範數據使用和保護隱私的法律框架
6 .3通往道德的數據科學之路
 
第7章未來趨勢與成功準則
7.1醫療數據科學
7.2智慧城市
7.3數據科學項目準則:為什麼會成功或失敗
7.4終極思考
 
術語表
延伸閱讀
參考文獻


作者介紹


[愛爾蘭]約翰· D.凱萊赫(John D. Kelleher),布倫丹·蒂爾尼(Brendan Tierney)著:
約翰· D.凱萊赫(John D. Kelleher)是都柏林理工學院計算機科學學院的教授以及信息、通信和娛樂研究所的學術負責人。他的研究得到了ADAPT中心的支持,該中心由愛爾蘭科學基金會(Grant 13 / RC / 2106)資助,同時也接受歐洲區域發展基金的資助。他還是《Fundamentals of Machine Learning for Predictive Data Analytics》的作者之一。
布倫丹·蒂爾尼(Brendan Tierney)是都柏林理工學院計算機科學學院的講師,同時也是Oracle ACE主任,還著有多本基於Oracle技術的數據挖掘類著作。




相關書籍

Applied Deep Learning: A Case-Based Approach to Understanding Deep Neural Networks

作者 Umberto Michelucci

2019-10-01

精實AI|新創企業如何運用人工智慧獲得成長 (Lean AI)

作者 Lomit Patel 張雅芳 譯

2019-10-01

Python數據分析與應用

作者 王愷 路明曉 於剛 張月久

2019-10-01