資料科學家的實用統計學 : 運用 R 和 Python 學習 50+個必學統計概念, 2/e (Practical Statistics for Data Scientists: 50+ Essential Concepts Using R and Python, 2/e)

資料科學家的實用統計學 : 運用 R 和 Python 學習 50+個必學統計概念, 2/e (Practical Statistics for Data Scientists: 50+ Essential Concepts Using R and Python, 2/e)

作者: Peter Bruce Andrew Bruce Peter Gedeck 洪巍恩 譯
出版社: 歐萊禮
出版在: 2021-07-30
ISBN-13: 9789865028411
ISBN-10: 9865028417
裝訂格式: 平裝
總頁數: 368 頁





內容描述


運用R和Python學習50+個必學統計概念

「這本書並非是另一本統計學教科書,也不是機器學習手冊。本書透過清楚的解釋和豐富範例,將實用的統計術語及原理和當今資料探勘的行話及實務聯繫起來。對資料科學的初學者和老手來說,這都是一本非常出色的參考書。」
—Galit Shmueli, 暢銷書《Data Mining for Business Analytics》主要作者,台灣清華大學特聘教授

統計方法是資料科學很重要的部分,然而很少有資料科學家接受過正式的統計訓練,而一般的課程及書籍亦很少從資料科學的角度來講解基礎統計學。因此本書第二版新增了詳盡的Python範例,提供讀者如何將統計方法應用於資料科學的實用指南、如何避免誤用統計方法,以及該注意的建議。

資料科學的學習資源或多或少有採用統計方法,但卻缺乏更深入的統計觀點,如果你熟悉R或Python程式語言,並對統計學有所了解,那麼這本書將以易懂的方式來幫助你學習。

透過本書,你將會學習到:
‧為何探索式資料分析是資料科學關鍵的第一步
‧隨機抽樣如何減少偏誤,並產生更高品質的資料集
‧實驗設計的原理是如何針對問題得出明確的答案
‧如何使用迴歸來預測結果並檢測異常
‧用來預測紀錄所屬類別的重要分類方法
‧從資料中「學習」的統計機器學習方法
‧從無標籤資料中提取有意義訊息的非監督式學習方法


目錄大綱


第一章 探索式資料分析
第二章 資料和抽樣分布
第三章 統計實驗與顯著性檢驗
第四章 迴歸與預測
第五章 分類
第六章 統計機器學習
第七章 非監督式學習
參考書目
索引


作者介紹


Peter Bruce 是Statistics.com統計教育學院的創辦人
Andrew Bruce 是Amazon的首席研究科學家,擁有30多年的統計及資料科學經驗
Peter Gedeck 在Collaborative Drug Discovery擔任資深資料科學家,致力於開發機器學習演算法來預測候選藥物的性質




相關書籍

Python Natural Language Processing Cookbook: Over 50 recipes to understand, analyze, and generate text for implementing language processing tasks

作者 Antic Zhenya

2021-07-30

數據結構與算法:Python語言描述(第2版)

作者 裘宗燕

2021-07-30

零基礎學R語言數據分析:從機器學習、數據挖掘、文本挖掘到大數據分析

作者 李仁鐘 李秋緣

2021-07-30