最終更新日 2015年6月22日

独立成分分析(ICA)による因果推定

説明

独立成分分析は、合成されたものを、互いに独立な成分に分解する事ができる。




独立成分分析が互いに独立な成分に分解することを利用して因果方向と強さを分析する。


2系列のデータがあり、一方が原因で他方が結果の場合、このデータ間は独立ではない。
これを独立成分分析を行うと、独立の成分に分解されるので、非独立の情報は分解行列に残っているはずである。
この分解行列を分析すると因果の方向と強さが分かる。



線形事例@


直線上にノイズが乗ったデータを考える。この場合定義式から原因は x で 結果は y である。

図中の点からだけでは、x と y は対等に見える


独立成分分析を行うと以下の独立成分が得られ、x と y はランダムな関係に分解されている


得られた独立成分分解行列


独立成分行列を下三角行列に変換すると x が y の原因である確率は(102.67対0.16)で以下で得られる

この場合定義式通り x が原因である確率が100%になっている。



非線形事例A


今度はSIN関数にノイズが乗ったデータを考える。


同様に x が原因の確率が以下で得られる

原因が x の確率は51.5%で y の確率は48%で辛うじて判別できているが

独立成分分析は線形モデルなので、非線形の場合は判定が難しいことを示している。




実用事例B


米国の銀行員の初任給 salbeg と現在の給与 salnow に因果関係があるか分析する

図だけだと初任給と現在の給与に高い相関しかわからない


分析すると初任給 salbeg が95%の確率で、現在の給与の原因になっている

この銀行で給与は初任給の段階でほぼ決まることを示している。

独立成分分析によって相関以上の因果情報まで得ることができている




戻る