統計學:基於R的應用
內容描述
統計學是一門資料分析的學科,被廣泛應用於生產、生活和科學研究的各個領域。在電腦和網際網路普及的今天,統計軟體的使用,不僅促進了統計科學的發展,也使統計學習發生了革命性的變化。當我們把計算交給電腦「秒殺」的時候,就能有更多的時間去理解統計方法的原理,就會發現統計學習和應用並不困難。
R語言是一款統計計算語言,它有許多優點,包括:
1.比起大多數的統計軟體,R是免費的。
2.更新速度快,包含很多最新方法,使用上更靈活。
3.提供豐富的資料分析技術,功能十分強大。
4.多樣化的繪圖功能,有助於對資料進行視覺化分析。
由於R的強大功能及使用上的靈活性,在實際工作及科學研究上,已逐漸成為資料分析的主流。
•注重統計思維和方法應用。
強調對統計思維的理解和方法應用,並以實際案例引出學習內容及目標。
•使用R完成計算和分析。
本書所有例題皆以R完成計算及分析,以便讀者瞭解R語言的功能和特點。
•注重統計方法之間的邏輯。
以圖解方式展示各章內容,方便讀者清楚掌握統計方法間的融會貫通。
目錄大綱
第1章 資料與統計學
問題與思考:怎樣理解統計結論
1.1 統計學及其應用
1.1.1 什麼是統計學
1.1.2 統計學的應用
1.2 資料及其來源
1.2.1 變數與資料
1.2.2 資料的來源
1.3 R簡介
1.3.1 R的初步使用
1.3.2 資料的錄入、讀入與保存
1.3.3 資料的使用和編輯
1.3.4 資料類型的轉換
1.3.5 函數的編寫
本書圖解:統計方法分類與本書架構
主要術語
思考與練習
第2章 用圖表展示資料
問題與思考:怎樣用圖表看資料
2.1 類別資料的圖表展示
2.1.1 用次數分配表觀察類別資料
2.1.2 用圖形展示類別資料
2.2 數值資料的圖表展示
2.2.1 用次數分配表觀察資料分配
2.2.2 用圖形展示數值資料
2.3 使用圖表的注意事項
本章圖解:資料類型與圖表展示方法
主要術語
思考與練習
第3章 用統計量描述資料
問題與思考:怎樣分析學生的考試成績
3.1 水準的描述
3.1.1 平均數
3.1.2 中位數和分位數
3.1.3 水準代表值的選擇
3.2 差異的描述
3.2.1 全距和四分位距
3.2.2 變異數和標準差
3.2.3 變異係數
3.2.4 標準得分
3.3 分配形狀的描述
3.4 資料的綜合描述
本章圖解:資料分配特徵與描述統計量
主要術語
思考與練習
第4章 隨機變數的機率分配
問題與思考:彩券中獎的機率有多大
4.1 什麼是機率
4.2 隨機變數的機率分配
4.2.1 隨機變數及其概括性量數
4.2.2 隨機變數的機率分配
4.2.3 其他幾個重要的統計分配
4.3 樣本統計量的機率分配
4.3.1 統計量及其分配
4.3.2 樣本平均數的分配
4.3.3 其他統計量的分配
4.3.4 統計量的標準誤差
本章圖解:隨機變數的機率分配
主要術語
思考與練習
第5章 參數估計
問題與思考:科學家做出重大貢獻時的最佳年齡是多少
5.1 參數估計的基本原理
5.1.1 點估計與區間估計
5.1.2 評量估計量的標準
5.2 母體平均數的區間估計
5.2.1 一個母體平均數的估計
5.2.2 兩個母體平均數之差的估計
5.3 母體比例的區間估計
5.3.1 一個母體比例的估計
5.3.2 兩個母體比例之差的估計
5.4 母體變異數的區間估計
5.4.1 一個母體變異數的估計
5.4.2 兩個母體變異數比的估計
5.5 樣本量的確定
5.5.1 估計母體平均數時樣本量的確定
5.5.2 估計母體比例時樣本量的確定
本章圖解:參數估計所使用的分配
主要術語
思考與練習
第6章 假設檢定
問題與思考:你相信飲用水瓶子標籤上的說法嗎
6.1 假設檢定的基本原理
6.1.1 怎樣提出假設
6.1.2 怎樣做出決策
6.1.3 怎樣表述決策結果
6.2 母體平均數的檢定
6.2.1 一個母體平均數的檢定
6.2.2 兩個母體平均數之差的檢定
6.3 母體比例的檢定
6.3.1 一個母體比例的檢定
6.3.2 兩個母體比例之差的檢定
6.4 母體變異數的檢定
6.4.1 一個母體變異數的檢定
6.4.2 兩個母體變異數比的檢定
6.5 非參數檢定
6.5.1 母體分配的檢定
6.5.2 母體位置參數的檢定
本章圖解:假設檢定的內容架構
主要術語
思考與練習
第7章 類別變數分析
問題與思考:網購滿意度與地區有關係嗎
7.1 一個類別變數的適合度檢定
7.1.1 期望次數相等
7.1.2 期望次數不等
7.2 兩個類別變數的獨立性檢定
7.2.1 列聯表與χ2獨立性檢定
7.2.2 應用χ2檢定的注意事項
7.3 兩個類別變數的相關性量數
7.3.1 φ係數和Cramer’s V係數
7.3.2 列聯係數
本章圖解:類別變數分析方法75
主要術語
思考與練習
第8章 變異數分析
問題與思考:超市位置和競爭者數量對銷售額有影響嗎
8.1 變異數分析的基本原理
8.1.1 什麼是變異數分析
8.1.2 誤差分解
8.2 單因子變異數分析
8.2.1 數學模型
8.2.2 效果檢定
8.2.3 多重比較
8.3 二因子變異數分析
8.3.1 數學模型
8.3.2 主效果分析
8.3.3 交互效果分析
8.4 變異數分析的假定及其檢定
8.4.1 常態性檢定
8.4.2 變異數同質性檢定
8.5 單因子變異數分析之非參數方法
本章圖解:變異數分析過程
主要術語
思考與練習
第9章 一元線性迴歸
問題與思考:GDP與消費水準有關係嗎
9.1 變數間的關係
9.1.1 確定變數之間的關係
9.1.2 相關關係的描述
9.1.3 關係強度的度量
9.2 一元線性迴歸模型的估計和檢定
9.2.1 一元線性迴歸模型
9.2.2 參數的最小平方估計
9.2.3 模型的適合度
9.2.4 模型的顯著性檢定
9.3 利用迴歸方程進行預測
9.3.1 平均數的信賴區間
9.3.2 個別值的預測區間
9.4 迴歸模型的診斷
9.4.1 殘差與殘差圖
9.4.2 檢定模型假定
本章圖解:一元線性迴歸的建模過程
主要術語
思考與練習
第10章 多元線性迴歸 /367
問題與思考:逾期放款受哪些因素影響
10.1 多元線性迴歸模型
10.1.2 參數的最小平方估計
10.2 適合度和顯著性檢定
10.2.1 模型的適合度
10.2.2 模型的顯著性檢定
10.2.3 模型診斷
10.3 多重共線性及其處理
10.3.1 多重共線性及其識別
10.3.2 變數選擇與逐步迴歸
10.4 相對重要性和模型比較
10.4.1 自變數的相對重要性
10.4.2 模型比較
10.5 利用迴歸方程進行預測
10.6 虛擬變數迴歸
10.6.1 在模型中引入虛擬變數
10.6.2 含有一個虛擬變數的迴歸
本章圖解:多元線性迴歸的建模過程
主要術語
思考與練習
第11章 時間序列預測
問題與思考:如何預測社會消費品零售總額
11.1 時間序列的成分和預測方法
11.1.1 時間序列的成分
11.1.2 預測方法的選擇與評估
11.2 指數平滑預測
11.2.1 指數平滑模型的一般表達
11.2.2 簡單指數平滑預測
11.2.3 Holt指數平滑預測
11.2.4 Winter指數平滑預測
11.3 趨勢外推預測
11.3.1 線性趨勢預測
11.3.2 非線性趨勢預測
11.4 分解預測
本章圖解:時間序列預測的程式和方法
主要術語
思考與練習
附錄 求信賴區間的自助法
各章習題解答
參考文獻