Stata統計分析:社會科學應用指南
內容描述
本書基於社會學領域學生和學者的需求,將統計學的理論概念和詳細的技術指導有機結合起來,通過眾多來自社會學不同領域的有趣示例來呈現豐富的統計方法和模型,鼓勵讀者在瞭解理論的同時學習應用Stata軟件來實現研究的目的。本書除了用5個章節漸進式地詳細闡述線性回歸模型之外,還進一步涵蓋logistic回歸、多層次分析、面板數據分析、探索性因子分析、結構方程模型和驗證性因子分析等內容。本書通過配套網站提供各章配套的測試題、視頻、數據集和Stata代碼,方便讀者學習並檢查學習效果。 本書可作為社會學領域本科生或研究生定量研究課程的教材或參考書,也可作為想要學習應用Stata軟件進行定量研究的社會學者的參考書。
目錄大綱
目錄
1 研究與統計學 1
1.1 統計研究方法論 2
1.2 統計方法 3
1.3 統計推斷的基本思想 5
1.3.1 概率論 5
1.3.2 總體規模 6
1.3.3 研究總體時為什麽需要顯著性水平? 8
1.4 通用法則和理論 8
1.4.1 客觀性和批判現實主義 9
1.5 定量研究論文 10
1.6 總結 12
問題 13
延伸閱讀 13
參考文獻 14
2 Stata簡介 17
2.1 Stata是什麽? 18
2.1.1 Stata界面 18
2.1.2 如何使用 Stata 20
2.2 數據輸入和導入 22
2.2.1 輸入數據 22
2.2.2 導入數據 23
2.3 數據管理 24
2.3.1 打開數據 25
2.3.2 檢查數據 25
2.3.3 修改變量 27
2.3.4 生成變量 29
2.3.5 數據子集 32
2.3.6 標記變量 32
2.4 描述性統計和圖 33
2.4.1 頻率分佈 33
2.4.2 匯總統計 35
2.4.3 縱向合並數據 38
2.4.4 橫向合並數據 39
2.4.5 數據變型 40
2.5 雙變量統計推斷 41
2.5.1 相關 41
2.5.2 獨立 t檢驗 41
2.5.3 方差分析(ANOVA) 42
2.5.4 卡方檢驗 43
2.6 總結 44
問題 45
延伸閱讀 45
3 簡單(雙變量)回歸 47
3.1 什麽是回歸分析? 48
3.2 簡單線性回歸分析 49
3.2.1 普通最小二乘法 52
3.2.2 擬合優度 54
3.2.3 斜率系數的假設檢驗 57
3.2.4 線性回歸預測 59
3.3 Stata實例 60
3.4 總結 64
問題 64
延伸閱讀 65
參考文獻 65
4 多元回歸 67
4.1 多元線性回歸分析 68
4.1.1 估計 69
4.1.2 擬合優度和 F檢驗 70
4.1.3 調整 R2 71
4.1.4 偏回歸系數 71
4.1.5 多元回歸預測 73
4.1.6 標準化和相對重要性 74
4.2 Stata實例 75
4.3 總結 81
問題 82
延伸閱讀 82
參考文獻 83
5 虛擬變量回歸 85
5.1 為什麽使用虛擬變量回歸? 86
5.1.1 生成虛擬變量 86
5.1.2 虛擬變量回歸的原理 89
5.2 含有一個虛擬變量的回歸 89
5.2.1 Stata示例 90
5.3 含有一個虛擬變量和一個協變量的回歸 91
5.3.1 Stata示例 93
5.4 含有多個虛擬變量的回歸 94
5.4.1 Stata示例 96
5.4.2 比較納入組 97
5.5 含有多個虛擬變量和一個協變量的回歸 101
5.5.1 Stata示例 102
5.6 含有兩組不同虛擬變量的回歸 103
5.6.1 Stata示例 105
5.7 總結 107
問題 108
延伸閱讀 108
參考文獻 109
6 回歸中的交互 /調節效應
111
6.1 交互 /調節效應 112
6.2 乘積項方法 113
6.2.1 一個連續預測變量與一個連續調節變量間的交互 115
6.2.2 一個連續預測變量與一個虛擬調節變量間的交互 119
6.2.3 一個虛擬預測變量與一個虛擬調節變量間的交互 123
6.2.4 一個連續預測變量和一個多分類調節變量間的交互 125
6.3 總結 131
問題 132
延伸閱讀 132
參考文獻 133
7 線性回歸的假設與診斷 135
7.1 正確設定模型 137
7.1.1 所有有關的 X變量,而沒有無關的 137
7.1.2 線性 139
7.1.3 可加性 148
7.1.4 不存在多重共線性 148
7.2 殘差的假設 150
7.2.1 誤差項的條件均值為零 150
7.2.2 同方差 151
7.2.3 不相關的誤差 152
7.2.4 正態分佈誤差 153
7.3 強影響點 155
7.3.1 杠桿作用 155
7.3.2 DFBETA 156
7.3.3 庫克距離 157
7.4 總結 159
問題 160
延伸閱讀 160
參考文獻 160
8 logistic回歸 163
8.1 什麽是 logistic回歸? 165
8.1.1 假設檢驗 168
8.2 logistic回歸的假設 169
8.2.1 Stata示例 171
8.3 條件效應 178
8.4 診斷 180
8.5 多類 logistic回歸 183
8.6 有序 logistic回歸 188
8.7 總結 192
問題 193
延伸閱讀 193
參考文獻 194
9 多水平分析 197
9.1 多水平數據 199
9.1.1 使用多水平分析的統計學原因 202
9.2 空模型或截距模型 203
9.2.1 Stata示例 205
9.3 方差分解或組內相關 206
9.4 隨機截距模型 207
9.5 水平
2解釋變量 209
9.5.1 因變量被解釋的量 211
9.6 logistic多水平模型 212
9.7 隨機系數(斜率)模型 213
9.8 交互效應 216
9.9 三水平模型 219
9.9.1 交叉分類多水平模型 223
9.10 加權 223
9.11 總結 225
問題 226
延伸閱讀 226
參考文獻 227
10 面板數據分析 229
10.1 面板數據 230
10.2 混合 OLS 233
10.3 組間效應 239
10.4 固定效應(組內估計) 243
10.4.1 解釋固定效應 244
10.4.2 固定效應總結 252
10.4.3 時間固定效應 252
10.5 隨機效應 253
10.6 時間序列橫截面方法 255
10.6.1 非平穩性檢驗 259
10.6.2 滯後選擇 262
10.6.3 TSCS模型 263
10.7 二分類因變量 264
10.8 總結 268
問題 269
延伸閱讀 269
參考文獻 270
11探索性因子分析 273
11.1 什麽是因子分析? 274
11.1.1 因子分析的用途 276
11.2 因子分析過程 276
11.2.1 提取因子 277
11.2.2 確定因子數量 280
11.2.3 旋轉因子 281
11.2.4 提煉和解釋因子 283
11.3 綜合得分和信度檢驗 285
11.4 Stata示例 286
11.5 總結 292
問題 293
延伸閱讀 293
參考文獻 294
12 結構方程模型和驗證性因子分析 297
12.1 什麽是結構方程模型? 298
12.1.1 結構方程模型的類型 299
12.2 驗證性因子分析 301
12.2.1 模型設定 301
12.2.2 模型識別 303
12.2.3 參數估計 305
12.2.4 模型評價 306
12.2.5 模型修正 314
12.3 潛路徑分析 316
12.3.1 LPA模型的設定 317
12.3.2 測量部分 318
12.3.3 結構部分 322
12.4 總結 324
問題 325
延伸閱讀 325
參考文獻 326
13 重要問題 329
13.1 變量變換 330
13.1.1 偏度和峰度 330
13.1.2 變換 333
13.2 加權 335
13.3 穩健回歸 338
13.4 缺失數據 342
13.4.1 處理缺失數據的傳統方法 343
13.4.2 多重填補 346
13.5 總結 353
問題 353
延伸閱讀 354
參考文獻 354
作者介紹
穆罕默德·梅赫梅托(Mehmet Mehmetoglu),挪威科技大學心理學系研究方法教授。
托爾·格奧爾格·雅備布森(Tor Georg Jakobsen),挪威科技大學商學院政治科學教授。