メモログ

塵が積もって山とならないメモのログ

本:因果推論の科学

因果推論の科学を読んだので簡単に紹介。因果推論とは、原因と結果の関係を理解し、それを推論するための方法論。従来の統計学では「XとYの相関関係」を説明できても、実際に知りたいのは「XがYにどう影響を与えているか?」という因果関係だったりする。因果推論は、その点で画期的なアプローチを示している。

本書では「因果のはしご」という3段階のモデルを中心に議論が展開されている。この因果のはしごは以下の3段で構成されている:

  1. 関連付け(観察)
  2. 介入(行動)
  3. 反事実

1段目の「関連付け」は、観察データに基づいて規則性を見出す段階。従来の統計学はこの段階に留まっていて、データの相関を観察するだけでは因果関係を明示的に理解することはできない。

2段目の「介入」では、特定の変数に介入して因果関係を明確にする。介入とは、全員の中から「喫煙者」を抽出するのではなく、「全員に喫煙させる」みたいなイメージ。喫煙を強制することで、喫煙へ至る経路を封鎖し、交絡因子を取り除き因果関係をクリアにする、みたいな感じ。ここで重要なのは介入を表すdo演算子の導入で、これによって「介入」の概念を数式で表すことができる。また、do演算子は、条件が揃えば通常の確率に変換することが可能で、これによって「介入」の効果を「観測」によってシミュレートすることができるようになる。1段目から2段目につなげていく部分は本書でも多くのページが割かれている。

3段目の「反事実」では「喫煙者がもし喫煙していなかったら、がんになる確率は下がるか」みたいな、事実とは異なる仮定を立てて推論する。因果関係が理解できていれば、それに基づいて因果が与える影響(因果効果)を推論することもできる。因果効果は直接効果と間接効果(媒介効果)に分解できるとされていて、因果効果を正しく測定するにはどちらも正しく理解していないといけない。直接効果に対して間接効果はわかりにくく、それが最終章の1つ前の9章「媒介」で書かれている。適切と思われた因果モデルが、新しい事実(喫煙遺伝子の存在とか)によって変更が必要になるかもしれなかったりして、適切な因果モデルを構築するには、たぶん、仮説検証の繰り返しなんだろうなあと思った。

AIの分野では、強いAIと弱いAIの話題がよく出るけど、『因果推論の科学』は、強いAIの実現に向けた一歩になる内容だと感じた。