第一章 绪论

一、引言

1. 因果关系的研究方向

  • 结果的原因
    • 考察某一种结果产生的原因,可能有很多,需要通过详细的调查和深入的分析才能找到。
  • 原因的结果
    • 关注某一干预对结果的影响,相对而言,这一方向更加简单,可操作性更强。
  • 二者密切相关
    • 搞清楚“原因的结果”,才有利于考察“结果的原因”,很多情况下更关注“原因的结果”。

2. 因果效应

  • 定义
    • 一项干预对结果变量产生的影响。
  • 例子
    • 新药的治疗效果。
    • 美国加州大学伯克利分校研究生录取是否存在性别歧视?

3. 因果推断的困难与挑战

  • 简单的直观印象往往是错误的,真理的揭示非常困难。
  • Yule-Simpson悖论
    • 当人们尝试探究两种变量(如新生录取率与性别)是否相关时,分组比较中都占优势的一方在总评中有时反而是失势的一方。

二、因果推断简史

1. 因果推断的起源和发展

  • Neyman(1923,1990):研究农业试验时首次提出潜在结果的概念。
  • Fisher(1935):提出随机化实验是因果推断的基础。
  • Rubin(1974,1977,1978):通过一系列论文重新提出并推广潜在结果的概念,奠定了现代因果推断的基础。
  • Rubin因果模型(Rubin Causal Model, RCM):核心是“潜在结果”的基本概念。

2. 经济学中的因果推断

  • Ashenfelter(1978)、Heckman and Robb(1985):因果推断的重要早期研究。
  • Havvelmo(1943):供求分析的联立方程理论中涉及潜在结果概念。
  • LaLonde(1986):使用美国70年代就业培训的随机化实验数据,研究传统方法是否能模拟实验结果。
  • Dehejia and Wahba(1999):利用倾向得分匹配方法重新审视LaLonde的研究问题。

3. 可信性革命及其影响

  • 强调设计,以随机化实验为研究设计的基础:
    • 对潜在结果建模,而非观测结果建模。
    • 将潜在结果与分配机制分离,科学设计使数据自动呈现因果效应。
  • 代表人物
    • David Card (UCB)、Alan Krueger (Princeton)、Guido Imbens (Stanford)、Joshua Angrist (MIT)、Alberto Abadie (Harvard)。

三、经济学研究的基本问题

  • 四个基本问题
    1. 感兴趣的因果效应问题是什么?
    2. 所需要的理想化实验是什么?
    3. 识别策略是什么?
    4. 是否满足统计充分性?

四、本书安排

  • 理论基础
    • 介绍“实验学派”计量经济学的基本理论。
  • 识别策略
    • 介绍利用观测数据进行因果推断的常见识别策略。

第一篇 理论基础

一、潜在结果框架

1. 构成要件

  • 潜在结果
    • 干预状态实现前,每个干预状态都有一个潜在结果。
    • 潜在结果与观测结果的区分是现代统计学和计量经济学的标志。
    • 描述性研究中没有干预,仅有一种状态的观测结果;因果研究中明确干预,每个个体有多个潜在结果。
  • 稳定性假设
    • 含义
      1. 不同个体的潜在结果之间无交互影响。
      2. 干预水平对所有个体相同。
  • 分配机制
    • 描述个体为何分配到干预组或控制组,或潜在结果的观测机制。
    • 分配机制可分为:
      • 随机化实验:由实验者控制,分配机制已知。
      • 观测研究:分配机制未知。

2. 潜在结果与Lord悖论

  • Lord Paradox
    • 假想案例:大学研究食堂膳食对学生体重的影响。
    • 两名统计学家用不同方法分析,得出相反结论:
      • 第一个统计学家比较平均体重,认为膳食无影响。
      • 第二个统计学家控制入学体重,用回归模型分析,发现男生增重更多。
    • 结论:悖论来源于潜在结果不清晰。

3. 因果效应参数

  • 定义
    • 总体平均因果效应 (Average Causal Effect, ATE):所有个体因果效应的平均值。
    • 干预组平均因果效应 (Average Treatment Effect for the Treated, ATT):受政策/处理影响的个体平均因果效应。
    • 控制组平均因果效应 (Average Treatment Effect for the Control, ATC):未受干预的个体在受到干预时的平均因果效应。

第二篇 识别策略

一、线性回归

二、匹配方法

三、工具变量法

四、面板数据方法

五、断点回归设计

六、结语