數據分析的力量 Google、Uber 都在用的因果關係思考法
內容描述
大數據+人的判斷力=發掘真相!
本書為資料分析入門書,聚焦於「廣告對業績有影響嗎?」、「實施某政策真能帶來良好影響嗎?」這類因果關係分析。序章使用各種實例,解說釐清因果關係為什麼是生意或政策的成功關鍵。第2章起不使用數學表達式,僅運用具體事例及視覺化的描寫,介紹隨機對照試驗、RD設計、縱橫資料分析等,可探究因果關係、最先進的資料分析手法。不使用數學表達式,僅透過簡明易懂的方式,解說隨機對照試驗(RCT)、RD設計(不連續迴歸設計)、堆集分析、縱橫資料分析等最先進有效的手法!
【本書介紹的主要具體事例】
.前美國總統歐巴馬於2012年總統大選時,因正確釐清競選廣告策略的因果關係,募得多達72億日圓的選舉資金。
.Google顯示的藍字,用的是透過因果分析實驗,從「41種藍色」中選出的最佳藍色。
.標示含稅價後,超市業績減少8%?
.Uber如何運用資料分析,調整最合適的費用?
.無償提供筆記型電腦,孩童的成績就會變好嗎?
.「節電請求」真能促進節電嗎?
.醫療費用的自負額降低,會使看病人數暴增嗎?
.汽車的油耗規定,真能提升燃油效率嗎?
.提高所得稅會使人們不想工作嗎?會使人們移居到稅金較低的國家嗎?
.廣發補助金的景氣刺激政策,真的有效果嗎?
本書特色
●日本AMAZON暢銷書,讀者4.5顆星好評
●以圖表為主、數式為輔,透過簡明易懂的方式,解說隨機對照試驗(RCT)、RD設計(不連續迴歸設計)、堆集分析、縱橫資料分析等最先進有效的手法!
●芝加哥大學哈里斯公共政策研究學院副教授伊藤公一朗親自撰寫,為想瞭解、分析大數據之人必備專業書籍
●本書榮獲日本第39回三得利學藝獎暨第60回日經・經濟圖書文化獎
目錄大綱
前言
第1章 從資料導出因果關係為什麼並不容易?
例1:廣告使冰淇淋的業績增加了?
例2:調漲電價能促進節電嗎?
例3:出國留學比較容易找到工作?
難以證明因果關係的原因1:有可能是其他因素造成影響
難以證明因果關係的原因2:有可能為反向因果關係
因果關係不同於相關關係
社會上充斥著啟人疑竇的資料分析結果
為什麼誤判因果關係會出問題?
讓小孩開著燈睡覺就會近視?
只要蒐集資料,就能排除所有的其他因素嗎?
即使增加資料觀察數也無法解決偏誤問題
第2章 在現實世界「實際進行實驗」――隨機對照試驗(RCT)
因果關係可用「介入效果」定義
難以導出因果關係是因為「如果」的資料並不存在
解決辦法就是介入組與比較組之概念
分組方式的壞例子:應要求予以介入(自行選擇)
最好的解決辦法就是「隨機對照試驗(RCT)」
為什麼隨機分組是關鍵?
RCT的具體事例1:北九州市的電價實地實驗
若採隨機分組,兩者的各項因素實際上是相等的
實驗結果:調漲電價真能促進節電嗎?
RCT的優點之一就是分析與結果具透明性
RCT的具體事例2:前美國總統歐巴馬競選活動的行銷策略
RCT的鐵則1:妥善建立群組
RCT的鐵則2:一定要隨機分組
RCT的鐵則3:各組的樣本數必須充足
歐巴馬陣營的實驗結果如何?
RCT的具體事例3:電力不足能靠道德解決嗎?價格政策有效嗎?
短期來看,道德政策與價格政策皆有效果
效果的持續性如何?
實際上該如何進行「隨機分組」?
RCT的優點與弱點
第3章 善加利用「界線」的RD設計
如果無法使用RCT該怎麼辦?介紹「自然實驗」手法
RD設計入門:以日本的醫療支出問題為例
著眼於醫療費用自負額變動之「界線」的分析手法
為什麼患者人數在70歲之「界線」上不連續地增加?
自負額從3成減少為1成後,門診患者人數增加10%左右
RD設計需要的假設
從醫療費用自負額的分析來看,RD設計的假設有可能成立嗎?
運用RD設計時分析者該做的事:檢驗其他因素是否在界線上發生不連續的跳躍
什麼情況會使RD設計的假設不成立?
RD設計是在界線附近製造近似RCT的狀況
RD設計有什麼弱點?
RD設計有什麼優點?
只因隔著1條界線,南北電價就大不相同?利用地理界線的RD設計
在「地理界線上」RD設計的假設成立嗎?
運用RD設計時,檢驗能否主張「針對某對象的因果關係」十分重要
第4章 善加利用「階梯狀變化」的堆集分析
汽車越大臺,油耗規定越寬鬆?
著眼於誘因呈階梯狀變化的日本油耗政策
只要繪製直方圖就能釐清企業行為
堆集分析與RD設計的差異
堆集分析的基本概念
堆集分析的假設
堆集分析的結果:油耗規定導致重量平均增加了110kg
堆集分析的優點和弱點是什麼?
堆集分析的事例:所得稅的稅率會影響工作方式嗎?
第5章 運用「數個期間的資料」的縱橫資料分析
要不要移居到所得稅較低的國家?所得稅與移民行動的因果關係分析
運用丹麥個人納稅資料的研究
縱橫資料分析的概念
縱橫資料分析需要的「平行趨勢假設」
關於平行趨勢假設,資料分析者可提供的2種資訊
何種情況會推翻平行趨勢假設?
縱橫資料分析的優點和弱點
縱橫資料分析的事例:撒錢實施景氣刺激政策只會增加搶購需求嗎?
第6章 實踐篇:如何將資料分析應用在經商或政策制定上?
矽谷平常都會運用RCT進行商業策略分析
美國聯邦政府內部推動的「循證政策制定」
評議會的使命
若要將資料分析應用在商業策略或政策制定上,關鍵是什麼?
成功關鍵1:與資料分析專家建立合作關係
成功關鍵2:開放資料
企業與資料分析者的夥伴關係事例1:加州大學、史丹佛大學與大型超市的合作
企業與資料分析者的夥伴關係事例2:加州大學與電力公司的合作
企業與資料分析者的夥伴關係事例3:芝加哥大學與Uber的合作
政府與資料分析者的夥伴關係事例1:芝加哥大學與芝加哥市的合作
政府與資料分析者的夥伴關係事例2:由經濟產業省資源能源廳主導的社會系統實證實驗
第7章 進階篇:了解資料分析的不完全性與極限
1 假如資料本身有問題,分析手法再出色也難以解決問題
2 分析結果的「外在效度」問題
3 「出版偏誤」與「夥伴關係偏誤」問題
4 介入存在「外溢效果」時的注意要點
5 存在一般均衡效果時的注意要點
第8章 給想進一步學習的人:參考書籍介紹
聚焦於計量經濟學實踐層面的日文入門書
讀完入門書後的中階書(經濟學院大學生程度)與高階書(研究所程度)
後記
引用文獻
數學附錄
作者介紹
伊藤公一朗(Koichiro Ito)
芝加哥大學哈里斯公共政策研究學院副教授。一九八二年出生於宮城縣。京都大學經濟學院畢業,加州大學柏克萊分校博士課程修畢(Ph.D.)。曾任史丹佛大學經濟政策研究院研究員、波士頓大學商學院副教授,二○一五年起從事現職。專攻環境能源經濟學、產業組織理論、應用計量經濟學。目前在芝加哥大學進行環境政策、能源政策的實證研究,同時也向研究生講授資料分析的理論與應用。授課內容與研究論文刊登於個人網站上(www.koichiroito.com)。