Weak Instruments

M.P. Murray (2006) "Avoiding Invalid Instruments and Coping with Weak Instruments", JEP 20(4), 111-132
を読んだ。


なぜWeak Instrumentsが問題かについて、わかりやすく書かれているので、
応用計量の人におすすめ。


簡単化された設定のもとでは、
2SLSを行った場合のバイアスは、

l×ρ×(1-R2) / (n×R2)

l: 操作変数の数
ρ: 第一段階の式の誤差項と第二段階の式の誤差項の相関係数
R2: 第一段階の推定式の相関係数(操作変数の強さ)
n: サンプル数


となる。
(「簡単化された設定」の内容は、説明変数が一個でそれが内生、第一段階の式の誤差項と第二段階の式の誤差項の分散がともに1、など)


サンプル数nが無限になれば、分母が無限になるのでバイアスはなくなるが、
nが有限の場合(finite sample)では、2SLSは常にバイアスを持つことになり、
特にR2が小さい場合にはそのバイアスが無視できないものになる。


また、操作変数が増えるとそのバイアスも大きくなるので、
R2の上昇に貢献しない操作変数を加えることは、リスクが伴うことも示している。


ρは、内生性の問題がどれだけ深刻化を表しているので、
内生性の問題が深刻な場合ほど、2SLSの値もバイアスを持ってしまうことを示している。


というように、上の式は、
Finite sampleの場合に、2SLSのバイアスがどんな要因によって左右されるかに関して、
非常にシンプルなExpressionを提供している。
Angrist and PischkeのMostly Harmless Econometricsでも、同様のことは紹介されているけれど、こちらの式の方がよりシンプル(その分、設定自体が単純化されているが)


また、論文中では、
Finite sampleでは、2SLSの分散の推計値は過小推計され、
特にWeak instrumentの場合ほど、その過小推計の度合いが強くなり、
帰無仮説が棄却されやすくなってしまう(Nelson and Startz, 1990)ということにも触れられており、
Stock and Yogo (2005)、Conditional likelihood testなどの検定や、Fuller's estimatorを使うことが推奨されている。


そして、
サンプル数が大きいとしても、Weak instrumentの場合には、Instrumentが"Almost" validでも大きなBiasを生んでしまうかもしれないので、InstrumentのValidityにはより十分な注意が必要となることや、
Heterogenous responseの問題についても触れられている。


短いし読みやすいので、
IVの問題点についてさっと知りたい人にはお勧め。