統計建模與 R軟件, 2/e

統計建模與 R軟件, 2/e

作者: 薛毅 陳立萍
出版社: 清華大學
出版在: 2021-12-01
ISBN-13: 9787302593928
ISBN-10: 7302593922
裝訂格式: 平裝
總頁數: 536 頁





內容描述


本書的第一版是國內較早系統地介紹R軟件的中文書籍,第二版教材對第一版的內容作了較大的改動,使內容的編排更加合理,同時增加了一些重要的知識點,以及擴展程序包中函數的介紹,減少自編函數的使用。 本版教材仍然延續第一版的風格,結合數理統計中的問題,對R軟件進行科學、準確和全面的介紹,以便使讀者能深刻理解該軟件的精髓精髓,以及靈活和高級的使用技巧。本版的讀者定位仍然是R的初學者,按照統計知識、統計模型、R相關函數的使用和示例來編排,使讀者即瞭解了統計的相關知識,又容易掌握與之對應的R函數的使用。


目錄大綱


目錄
第1章  R軟件簡介 1
1.1  R軟件的下載與安裝 1
1.2  R軟件的界面 2
1.2.1  主窗口 2
1.2.2  文件菜單 3
1.2.3  其他菜單 5
1.2.4  程序包菜單 5
1.2.5  幫助菜單 7
1.3  與數據有關的對象 8
1.3.1  純量 8
1.3.2  向量 9
1.3.3  因子 13
1.3.4  矩陣 15
1.3.5  數組 18
1.3.6  列表 21
1.3.7  數據框 23
1.4  向量與矩陣的運算 26
1.4.1  向量的四則運算 26
1.4.2  向量的內積與外積 27
1.4.3  矩陣的四則運算 28
1.4.4  矩陣的函數運算 29
1.4.5  求解線性方程組 30
1.4.6  矩陣分解 31
1.5  方程求解與優化問題 34
1.5.1  非線性方程求解 34
1.5.2  優化問題求解 36
1.6  讀、寫數據文件 38
1.6.1  讀純文本文件 38
1.6.2  讀取csv格式的表格數據 41
1.6.3  讀取Excel表格文件 41
1.6.4  數據集的讀取 43
1.6.5  寫數據文件 44
1.7  控制流 45
1.7.1  分支函數 46
1.7.2  中止語句與空語句 47
1.7.3  循環函數 47
1.8  R函數的編寫 49
1.8.1  函數定義 49
1.8.2  有名參數與默認參數 51
1.8.3  遞歸函數 52
1.9  程序運行與調試 52
1.9.1  建立自己的工作目錄 52
1.9.2  工作空間 53
1.9.3  作用域 53
1.9.4  程序調試 54
習題 155
第2章  概率、隨機變量及其分佈 57
2.1  隨機事件與概率 57
2.1.1  隨機事件 57
2.1.2  概率 58
2.1.3  古典概型 59
2.1.4  幾何概型 63
2.1.5  條件概率 64
2.1.6  概率的乘法公式、全概率公式、貝葉斯公式 65
2.1.7  獨立事件 66
2.1.8  n重伯努利試驗及其概率計算 66
2.2  隨機變量及其分佈 66
2.2.1  基本概念 66
2.2.2  常見的離散型隨機變量的分佈 69
2.2.3  常見的連續型隨機變量的分佈 73
2.3  隨機向量 78
2.3.1  定義及聯合分佈 78
2.3.2  離散型隨機向量 79
2.3.3  連續型二維隨機向量 79
2.3.4  邊緣分佈 79
2.3.5  隨機變量的獨立性 80
2.3.6  常見的二維隨機向量的分佈 81
2.4  隨機變量的數字特徵 82
2.4.1  數學期望 82
2.4.2  方差 82
2.4.3  幾種常用隨機變量的數學期望與方差 83
2.4.4  協方差與相關系數 84
2.4.5  矩 85
2.4.6  協方差矩陣和相關矩陣 85
2.5  極限定理 87
2.5.1  大數定律 87
2.5.2  中心極限定理 88
2.6  數理統計的基本概念 90
2.6.1  總體、個體、簡單隨機樣本 91
2.6.2  參數空間與分佈族 92
2.6.3  統計量 93
2.6.4  常用的統計量 93
2.6.5  抽樣 95
2.6.6  導出分佈 95
2.6.7  統計量的分佈 98
2.7  R中內置的分佈函數 100
習題2 101
第3章  數據描述性分析 104
3.1  描述統計量 104
3.1.1  位置的度量 104
3.1.2  分散程度的度量 109
3.1.3  分佈形狀的度量 111
3.2  數據的分佈 113
3.2.1  直方圖、經驗分佈圖與QQ圖 113
3.2.2  莖葉圖、箱線圖及五數總括 117
3.3  R軟件中的繪圖命令 122
3.3.1  高水平繪圖函數 122
3.3.2  高水平繪圖中的命令 133
3.3.3  低水平作圖函數 134
3.4  多元數據的數字特徵與相關分析 135
3.4.1  二元數據的數字特徵及相關系數 135
3.4.2  二元數據的相關性檢驗 137
3.4.3  多元數據的數字特徵及相關矩陣 139
3.4.4  基於相關系數的變量分類 142
3.5  多元數據的圖表示方法 146
3.5.1  輪廓圖 146
3.5.2  星圖 148
3.5.3  調和曲線圖 151
習題3 152
第4章  參數估計 154
4.1  點估計 154
4.1.1  矩法 154
4.1.2  極大似然法 158
4.2  估計量的優良性準則 164
4.2.1  無偏估計 164
4.2.2  有效性 166
4.2.3  相合性(一致性) 166
4.3  區間估計 167
4.4  單個總體的區間估計 168
4.4.1  均值估計: Z統計量 168
4.4.2  均值估計: t統計量 171
4.4.3  總體比例估計 173
4.5  兩個總體的區間估計 175
4.5.1  均值差的估計: Z統計量 175
4.5.2  均值差的估計: t統計量 177
4.5.3  總體比例差的估計 181
4.6  總體方差的估計 183
4.6.1  方差的估計 183
4.6.2  方差比的估計 186
習題4 188
第5章  假設檢驗 191
5.1  假設檢驗的基本概念 191
5.1.1  基本概念 191
5.1.2  假設檢驗的基本思想與步驟 193
5.1.3  假設檢驗的兩類錯誤 193
5.1.4  原假設和備擇假設的設置 194
5.2  重要的參數檢驗 194
5.2.1  Z檢驗 194
5.2.2  t檢驗 200
5.2.3  總體比例的檢驗 206
5.2.4  泊松分佈參數的檢驗 211
5.2.5  正態總體方差的檢驗 214
5.3  分佈的檢驗 216
5.3.1  皮爾遜擬合優度??檢驗 217
5.3.2  柯爾莫戈洛夫--斯米爾諾夫檢驗 222
5.3.3  正態性檢驗 224
5.4  列聯表檢驗 227
5.4.1  皮爾遜 ??獨立性檢驗 227
5.4.2  費希爾精確的獨立檢驗 230
5.4.3  麥克尼馬爾檢驗 232
5.5  符號檢驗 233
5.5.1  單個總體的檢驗 233
5.5.2  兩個總體的檢驗 234
5.6  秩檢驗 236
5.6.1  秩統計量 236
5.6.2  威爾科克森符號秩檢驗 238
5.6.3  威爾科克森秩和檢驗 240
5.6.4  配對數據的秩檢驗 242
5.7  秩相關檢驗 243
5.7.1  斯皮爾曼秩相關檢驗 243
5.7.2  肯德爾秩相關檢驗 245
5.7.3  多組數據的相關性檢驗 246
5.8  遊程檢驗 248
習題5 251
第6章  回歸分析 256
6.1  一元線性回歸分析 256
6.1.1  數學模型 256
6.1.2  回歸參數的估計 257
6.1.3  回歸方程的顯著性檢驗 258
6.1.4  參數? _0與? _1的區間估計 261
6.1.5  預測 261
6.1.6  計算實例 262
6.2  與線性回歸有關的函數 266
6.2.1  基本函數 266
6.2.2  提取模型信息的函數 266
6.3  多元線性回歸分析 269
6.3.1  數學模型 270
6.3.2  回歸系數的估計 270
6.3.3  顯著性檢驗 271
6.3.4  示例 272
6.3.5  回歸系數的區間估計 274
6.3.6  預測 274
6.3.7  修正擬合模型 275
6.3.8  計算實例 275
6.4  逐步回歸 279
6.4.1  “最優”回歸方程的選擇 279
6.4.2  逐步回歸的計算 280
6.5  回歸診斷 284
6.5.1  回歸診斷的重要性 284
6.5.2  殘差 287
6.5.3  殘差圖 289
6.5.4  殘差的獨立性檢驗 293
6.5.5  影響分析 295
6.6  多重共線性的診斷 301
6.6.1  什麽是多重共線性 301
6.6.2  多重共線性的發現 301
6.7  廣義線性回歸模型 305
6.7.1  與廣義線性模型有關的R函數 305
6.7.2  正態分佈族 306
6.7.3  二項分佈族 308
6.7.4  泊松分佈族 313
6.7.5  其他分佈族 315
6.8  非線性回歸模型 316
6.8.1  多項式回歸模型 317
6.8.2  (內在)非線性回歸模型 320
習題6 325
第7章  方差分析 330
7.1  單因素方差分析 330
7.1.1  數學模型 331
7.1.2  方差分析 331
7.1.3  方差分析表的計算 333
7.1.4  均值的多重比較 336
7.2  單因素方差分析的進一步討論 340
7.2.1  誤差的正態性檢驗 340
7.2.2  方差齊性檢驗 341
7.2.3  非齊方差數據的方差分析 342
7.3  秩檢驗 342
7.3.1  克魯斯卡爾--沃利斯秩和檢驗 342
7.3.2  弗里德曼秩和檢驗 345
7.4  雙因素方差分析 347
7.4.1  不考慮交互效應 347
7.4.2  考慮交互效應 350
7.4.3  方差齊性檢驗 354
7.5  正交試驗設計與方差分析 355
7.5.1  用正交表安排試驗 355
7.5.2  正交試驗的方差分析 358
7.5.3  有交互效應的試驗 359
7.5.4  有重復試驗的方差分析 362
習題7 363
第8章  應用多元分析(I) 367
8.1  判別分析 367
8.1.1  判別分析的基本概念 367
8.1.2  距離判別 369
8.1.3  貝葉斯判別 375
8.1.4  費希爾判別 380
8.1.5  判別分析的進一步討論 384
8.1.6  擴展程序包中的判別函數 388
8.2  聚類分析 393
8.2.1  距離和相似系數 393
8.2.2  系統聚類法 399
8.2.3  動態聚類法 409
習題8 411
第9章  應用多元分析(II} 414
9.1  主成分分析 414
9.1.1  總體主成分 414
9.1.2  樣本主成分 417
9.1.3  相關函數的介紹及實例 420
9.1.4  主成分分析的應用 425
9.2  因子分析 429
9.2.1  引例 430
9.2.2  因子模型 431
9.2.3  參數估計 432
9.2.4  方差最大的正交旋轉 441
9.2.5  因子分析的計算函數 443
9.2.6  因子得分 446
9.3  典型相關分析 448
9.3.1  總體典型相關 449
9.3.2  樣本典型相關 451
9.3.3  典型相關分析的計算 452
9.3.4  典型相關系數的顯著性檢驗 454
習題9 456
第10章  數據可視化 459
10.1  多維標度法 459
10.1.1  多維標度法的基本概念 459
10.1.2  多維標度法的古典解 460
10.1.3  非度量方法 467
10.1.4  實例計算 469
10.2  對應分析 471
10.2.1  引例 472
10.2.2  對應分析的計算公式 473
10.2.3  R計算與繪圖 475
10.3  樣本與變量的雙重信息圖 479
10.3.1  雙重信息圖的構造 479
10.3.2  R作圖 482
習題10 487
附錄 489
A. R 函數索引 489
B. 習題參考答案 497
參考文獻 520


作者介紹


薛毅,一直從事數學建模、計算數學和運籌學方面的教學與科研工作。主講多門本科生、研究生課程,其中“數學建模”課程榮獲北京市精品課程(2005年度)。出版著作或教材17部,譯著2部,其中《數學建模基礎》和《數值分析與科學計算》獲得北京市高等教育精品教材獎(2006年度和2013年度),《數學建模基礎》獲國家“十一五”規劃教材,《統計建模與R軟件》被譽為國內第一本系統介紹R的中文書籍。兩次被評為北京市優秀教師(2006年和2017年)。




相關書籍

Mathematica 錦囊妙計 (Mathematica Cookbook)

作者 Sal Mangano 林威仰 譯

2021-12-01

公職考試 2021 試題大補帖【抽樣方法與迴歸分析(含統計實務、統計實務概要)】(104~109年試題)(申論題型)[適用三等、四等/高考、普考、地方特考]

作者 百官網公職師資群

2021-12-01

統計學,最強的商業武器:實踐篇

作者 西內 啟 陳亦苓 譯

2021-12-01