第一章 绪论

一、引言

1. 因果关系的研究方向

  • 结果的原因
    • 考察某一种结果产生的原因,可能有很多,需要通过详细的调查和深入的分析才能找到。
  • 原因的结果
    • 关注某一干预对结果的影响,相对而言,这一方向更加简单,可操作性更强。
  • 二者密切相关
    • 搞清楚“原因的结果”,才有利于考察“结果的原因”,很多情况下更关注“原因的结果”。

2. 因果效应

  • 定义
    • 一项干预对结果变量产生的影响。
  • 例子
    • 新药的治疗效果。
    • 美国加州大学伯克利分校研究生录取是否存在性别歧视?

3. 因果推断的困难与挑战

  • 简单的直观印象往往是错误的,真理的揭示非常困难。
  • Yule-Simpson悖论
    • 当人们尝试探究两种变量(如新生录取率与性别)是否相关时,分组比较中都占优势的一方在总评中有时反而是失势的一方。

二、因果推断简史

1. 因果推断的起源和发展

  • Neyman(1923,1990):研究农业试验时首次提出潜在结果的概念。
  • Fisher(1935):提出随机化实验是因果推断的基础。
  • Rubin(1974,1977,1978):通过一系列论文重新提出并推广潜在结果的概念,奠定了现代因果推断的基础。
  • Rubin因果模型(Rubin Causal Model, RCM):核心是“潜在结果”的基本概念。

2. 经济学中的因果推断

  • Ashenfelter(1978)、Heckman and Robb(1985):因果推断的重要早期研究。
  • Havvelmo(1943):供求分析的联立方程理论中涉及潜在结果概念。
  • LaLonde(1986):使用美国70年代就业培训的随机化实验数据,研究传统方法是否能模拟实验结果。
  • Dehejia and Wahba(1999):利用倾向得分匹配方法重新审视LaLonde的研究问题。

3. 可信性革命及其影响

  • 强调设计,以随机化实验为研究设计的基础:
    • 对潜在结果建模,而非观测结果建模。
    • 将潜在结果与分配机制分离,科学设计使数据自动呈现因果效应。
  • 代表人物
    • David Card (UCB)、Alan Krueger (Princeton)、Guido Imbens (Stanford)、Joshua Angrist (MIT)、Alberto Abadie (Harvard)。

三、经济学研究的基本问题

  • 四个基本问题
    1. 感兴趣的因果效应问题是什么?
    2. 所需要的理想化实验是什么?
    3. 识别策略是什么?
    4. 是否满足统计充分性?

四、本书安排

  • 理论基础
    • 介绍“实验学派”计量经济学的基本理论。
  • 识别策略
    • 介绍利用观测数据进行因果推断的常见识别策略。

第一篇 理论基础

一、潜在结果框架

1. 构成要件

  • 潜在结果
    - 干预状态实现前,每个干预状态都有一个潜在结果。
    - 潜在结果与观测结果的区分是现代统计学和计量经济学的标志。
    - 描述性研究中没有干预,仅有一种状态的观测结果;因果研究中明确干预,每个个体有多个潜在结果。
  • 稳定性假设
    • 含义
      1. 不同个体的潜在结果之间无交互影响。
      2. 干预水平对所有个体相同。
  • 分配机制
    • 描述个体为何分配到干预组或控制组,或潜在结果的观测机制。
    • 分配机制可分为:
      • 随机化实验:由实验者控制,分配机制已知。
      • 观测研究:分配机制未知。

2. 潜在结果与Lord悖论

  • Lord Paradox
    • 假想案例:大学研究食堂膳食对学生体重的影响。
    • 两名统计学家用不同方法分析,得出相反结论:
      • 第一个统计学家比较平均体重,认为膳食无影响。
      • 第二个统计学家控制入学体重,用回归模型分析,发现男生增重更多。
    • 结论:悖论来源于潜在结果不清晰。

3. 因果效应参数

  • 定义
    • 总体平均因果效应 (Average Causal Effect, ATE):所有个体因果效应的平均值。
    • 干预组平均因果效应 (Average Treatment Effect for the Treated, ATT):受政策/处理影响的个体平均因果效应。
    • 控制组平均因果效应 (Average Treatment Effect for the Control, ATC):未受干预的个体在受到干预时的平均因果效应。

二、随机化实验

1. 随机化实验的作用

  • 随机化实验是因果推断的黄金标准,是观测研究的基础
    • 随机化实验在统计学中不是什么新内容,但在经济学研究中是比较新的。
    • 近年来,在MIT经济学教授Duflo和Banerjee夫妇等人的推动下,成为经济政策研究的重要实证方法。
  • 随机化实验采用不同的思路,它不要求将所有其他因素控制住,只要求干预分配是随机的
    • 随机化的好处在于不需要控制其他的可能影响因素,因为我们关心的原因变量取值是随机化的,从而使干预组织和控制组两组个体的其他影响因素差异都是偶然性的,两组个体结果变量的比较,就是该原因变量对结果变量的影响。
  • 随机化的关键作用使可以平衡两组个体其他因素的分布

2. 随机化实验与选择偏差

3. 随机化实验的分类

  • 伯努利试验
  • 完全随机化实验
  • 分层随机化实验
  • 配对随机化实验

4. 随机化实验的分析

5. 随机化实验的缺陷


第二篇 识别策略

一、线性回归

二、匹配方法

三、工具变量法

四、面板数据方法

五、断点回归设计

六、结语