傾向值匹配法的概述與應用:從統計關聯到因果推論
內容描述
傾向值匹配法就是將各個受測單元多維度的信息,使用統計方法簡化成一維的數值,成為傾向值,然后據之進行匹配,匹配的目的就是要找尋實驗組和對照組樣本中擁有相同(或者相似)傾向值的樣本,它們之間的差異,就是因果關系。這個原理非常簡單,但聰明的讀者肯定會問,什么是多維度的信息?如何簡化它?這都是傾向值匹配法的關鍵也是容易發生問題的地方。本書的第1章將簡要介紹為什么要對多維信息進行降維處理,而第2章將進一步講解這背后的理論背景。第3章選擇了4篇學刊論文,對其中傾向值匹配方法的使用進行解析。第4章則就“應用R軟件和STATA 軟件實現傾向值匹配法”進行說明。
書中行文不可避免要使用到一些數學公式來輔助理論論述,對這些推演,作者盡可能以淺顯易懂的文字對這些推演過程的原理進行說明,略過這些公式并不會妨礙讀者對于理論的了解。
20世紀以來,社會科學學者越來越希望能像自然科學學者一樣,說因道果,以確立研究的“科學性”,然而他們的研究往往發現的是關聯性,而非因果關系。傾向值匹配法,在21世紀初橫空出世,成為當代定量方法中一顆閃耀的新星,正是因為宣稱可以解決因果推斷的基本難題。
作者蘇毓淞鉆研傾向值匹配法十年,他的基本觀點是:進行因果推斷的前設是嚴謹科學的研究設計,傾向值匹配法不能幫助我們發現因果關系,但它的確是有效協助解決因果推斷的一種研究方法,它改變了學者們處理因果推斷的思維方式,社會科學的研究者都值得學習和了解它。
目錄大綱
第1章因果推論理論概述
1.1潛在結果模型
1.1.1因果態與實驗分組
1.1.2因果推論的基本難題
1.1.3平均處理效用
1.2社會科學研究中的因果推論
1.2.1處理變量的可操作性
1.2.2單元同質性假定
1.2.3可忽略的處理分配假定
1.2.4控制混淆共變量
1.2.5穩定單元處理值假定
1.2.6共變量分佈平衡與重合的要求
1.2.7勿控制處理分配後的變量
1.3小結
第2章使用傾向值匹配法估計因果效用
2.1傾向值
2.1 .1傾向值的性質
2.1.2估計傾向值
2.2匹配法
2.2.1精確匹配法
2.2.2最近鄰匹配法
2.2.3區間匹配法
2.2.4核匹配法
2.2.5馬氏距離匹配法
2.2.6貪婪匹配法與最佳匹配法
2.3匹配後的檢驗
2.3.1共變量分佈不平衡分析
2.3.2共變量分佈不重合分析
2.3.3選擇性偏差與敏感性分析
2.4匹配後估計平均處理效用
2.4.1使用回歸模型估計平均處理效用
2.4.2平均處理效用的標準誤差
2.4.3非二元處理下的平均處理效用
2.5小結
第3章社會科學案例選讀
3.1案例評析重點
3.2教育學案例:計算機的使用對中學生數學成績的影響
3.3心理學案例:獨生和非獨生子女情緒適應的差異
3.4政治學案例:候選人議題立場與選民投票抉擇
3.5經濟學案例:企業貿易形態與工資水平
第4章應用R軟件和S7A了A軟件實現傾向值匹配法
4.1 R程序包
4.2 STATA程序插件
4.3使用R進行傾向值匹配分析LaLonde數據
4.4使用STATA進行傾向值匹配分析LaLonde數據
參考文獻
表目錄
表1 .1因果推論的基本難題
表1.2二元處理下的虛擬實驗數據
表2.1兒童血鉛水平的敏感性分析結果
表4.1 LaLonde數據中的變量
作者介紹
蘇毓淞,清華大學政治學系副教授,美國紐約市立大學政治學系政治學專業博士。