介绍一个万能的工具变量 Bartik-IV
一、引言
我们从近期的一篇《经济学(季刊)》的文章出发,这篇文章的标题是《破坏金融管理秩序犯罪加剧了企业融资约束》。
这篇文章研究的内容是这样的:
地区的金融犯罪频发时,银行感知到风险与不确定性后势必会调整信贷决策,这很可能会影响到企业的信贷可得性与融资约束。
这篇文章就研究了破坏金融管理秩序罪对企业融资约束的影响。
- 金融融资约束:以按照年份标准化后的企业规模、年龄和现金股利支付率的均值构建虚拟变量(高于1/3分位数取值为0,否则为1)
- 破坏金融管理秩序犯罪:城市的破坏金融管理秩序犯罪率,使用破坏金融管理秩序罪的一审刑事判决书数量(件)与城市常住人口(万人)的比值,以及一审刑事判决书中的被告人数量(人)与城市常住人口(万人)的比值进行度量
简单理解就是:研究一个城市的案件数/总人口或者犯罪人数/总人口对融资约束01变量的影响。
二、工具变量的选择
这篇文章采取的工具变量放在了附录当中。
总共采用了两个工具变量:
- 第一,使用移动份额法构建Bartik工具变量;
- 第二,以虚拟货币关注度作为破坏金融管理秩序犯罪的工具变量。
假设我的读者已经了解一般工具变量选择,在理解相关性和外生性两个假设的基础上,本文将着重介绍Bartik工具变量。
三、Bartik 工具变量介绍
Bartik工具最早由Timothy Bartik(1991)提出,后经Blanchard和Katz(1992)推广普及。Bartik工具由地区行业层面份额和国家行业层面增长率的交互项形成,基于不同暴露情况的地区或行业在遭受相同外生冲击时的反应进行设计,在劳动、公共、发展、宏观、国贸和金融等领域的应用十分广泛。
考虑到知乎上的立青Jill已经详细介绍了Bartik工具变量的原理,本文将从工具变量选择的原则上解释Bartik工具变量的可用性,以及如何构建和stata应用。
假设我们的核心解释变量是,Bartik工具变量的构建见以下公式:
其中,是在时间基期前的行业(或国家/其他高维组别)的份额,是行业在时间的平均值。
我并没有进行太多的考证,但实际应用中往往可以不用份额来衡量,可以直接使用来代替。毕竟份额仅仅只是对的一个归一化处理。
以引言中季刊的这篇文章为例,他采用的Bartik工具变量构建见式 (2):
对应地来看:
- 是核心解释变量案件数/总人口;
- 份额是,表示2014
年城市𝑗的破坏金融管理秩序犯罪率(并没有换算成权重) - 移动是,表示t年城市𝑗所在省份𝑝的破坏金融管理秩序犯罪增长率。
简单地来说:
Share份额就是核心解释变量基期(或基期以前)的基准取值,只随个体异质,不随年份变动
Shift移动就是研究对象更高维度随时间变化的组间均值。
1. Bartik工具变量的相关性
Bartik工具变量的本质是利用个体初始的份额构成和总体的增长率来模拟出历年的估计值,得到的估计值与实际值之间高度相关,但与其他的残差项并不相关。
2. Bartik工具变量的外生性
Bartik工具变量估计以份额的外生性为前提。通常来说,一项研究中的核心解释变量之所以能够使用计量模型进行估计,是因为我们内含了核心解释变量满足计量模型的外生性假设,也即份额本身在研究中对被解释变量而言就是外生的,从而Bartik工具变量也满足外生性假设。
- 留一法Bartik工具变量 (leave-one-out bartik-IV):
简单来说,“留一法” 就是通过排除自身对组别的贡献,切断反向因果,从而强化工具变量的外生性。
在实际使用上,以季刊这篇文章为例,其移动Shift的均值构建应该剔除掉样本自身的破坏金融管理秩序犯罪率,只保留其他城市的增长率。
四、Bartik 工具变量的代码
以季刊那篇文章为例,下面的代码展示了如何在Stata中构建Bartik工具变量:
1 |
|
比较特殊的是,这篇文章的Shift用的是省份的增长率,而不是省份的均值水平。这样在不采用留一法的情况下,冲击Shift则能够更好的满足外生性。
参考文献
- 立青Jill. Bartik工具变量的来龙去脉:原理+应用[EB/OL]. 知乎, https://zhuanlan.zhihu.com/p/660930665.
- 魏建,薛启航,王慧敏.破坏金融管理秩序犯罪加剧了企业融资约束[J].经济学(季刊),2025,25(05):1202-1218.DOI:10.13821/j.cnki.ceq.2025.05.06.
- Bartik T J. Who benefits from state and local economic development policies? Kalamazoo, MI: WE Upjohn Institute for Employment Research[M]. 1991.