開発・実証(ミクロ)経済学の論文でbalance testは見せるべきか:実証ミクロ計量関連記事(1)
KEYWORDS: RCT, ランダム化比較試験, バランステスト, balance test, balancing test
いつまで続くか分からないが、なんとなく読者を増やしたくなったため(お金が欲しくなったため)、ニッチなテーマであるかもしれないが、専門的なことも書いていこうと思う。
いくつかリファレンスも上げる。そのため、説明はかなりざっくりしたものになる。論文を読む前にエッセンスを(日本語で)知りたい、自分の研究に加えたいけど、どうやっていいか分からない、そんな読者が対象になると思う。しかし、そうでなくても幅広い知識を得たいという人にも役に立つと思う。
少し教科書のまえがき風のことを書いたが、自分もまだ学生である。入学したての修士学生あたりがメインのターゲットになるかもしれない。読者の人は、学年とか感想をコメントしてくれるとこの連載(予定)も継続できるかなと思う。
本題
RCTブームが到来してからもうすぐ20年となるのだろうか(いつブームが起きたか、正確には知らない)。
フィールド実験のアプローチは開発と労働経済学の分野を中心に、大きな変化をもたらした。
詳細については昨年のノーベル経済学賞関連の記事を探して貰いたい。日本語でも、日本人の開発経済学者の方によるたくさんの記事がある。
前提として、RCTではtreatment(介入が)がランダムに行われていないといけない。論文ではそれを示す必要がある。これがbalance test(balancing testとも書かれる)である。
経済学のちゃんとした(ちゃんとしている定義とは何か、となるが、例えば安田先生の経済学者リストの作成基準に使われている雑誌はちゃんとしていると認識して貰いたい)雑誌に掲載されている論文では、これが表できちんと示されている。むしろ、balancedでない二郡の比較は、ランダム化がきちんと行えていない介入の結果を見ることになるため、balance testをクリアしていなければ、一流の雑誌に掲載されない。
また、自然実験のアプローチを用いて観察データを使用する場合でも、treatmentとcontrolグループ間のbalanceを示す必要がある。そのため、balance testはRCTの場合のみ行えばいいというものでもない。
どうやって行うか?
先に述べたように、treatmentとcontrolの二つのグループが(平均でみると)均質であることを示すことが目標だ。具体的に言うと、例えば、トレーニング(職業・農業訓練など)という介入をランダムに行った場合、介入を受けたグループと受けていないグループの特徴は統計的に似ている(同じ)であることが求められている。
その特徴はなんだ?となるが、これは回帰分析に含めるコントロール変数全て見せるも良し、代表的な家計の特徴(所得や教育水準)のみも良し。(すいません、ここはよく分かりません。しかし、全てのコントロール変数でバランスされている方が望ましいのは間違いない。)
シンプルなケースでは、t検定をすれば良い。Stataではttest
コマンドである。介入の変数がtreatment、教育年数の変数がeduc_yearsであるとすると、次のようになる。
ttest educ_years, by(treatment)
参考文献
David McKenzie執筆の世銀ブログはこの記事よりも突っ込んだ説明をしている。
blogs.worldbank.org
彼のこの記事の元論文はこちら。
www.aeaweb.org
Bruhn, Miriam, and David McKenzie. 2009. "In Pursuit of Balance: Randomization in Practice in Development Field Experiments." American Economic Journal: Applied Economics, 1 (4): 200-232.