最終更新日 2015年4月19日

グラフィカルLasso構造推定

説明

ベイジアンネットの構造学習にはスコアベースと制約ベースがある

スコアーベースノードのリンク状態毎に対数尤度MDL等を計算し最適なリンクを求める方法
制約ベース条件独立を検定して、条件独立なら非連結とする方法
統合ベース制約ベースで構造決定し、スコアベースで連結方向を決定する方法


統合ベースとして、Lassoで疎な構造を設定し、MDLで連結方向を決定した方法を提案する


事例

ベイジアンネットのベンチマークで有名な
タイタニック生存モデルをLassoによる最適グラフ構造推定を行う

@全乗船客のデータを読んで、ノード間の相互情報量を求める
A相互情報量の行列が疎になる様にLassoで解く
BLassoの疎な関係をノード間に設定する
CMDL基準で最適なベイジアンネットワークを算出する


タイタニック生存データの相互情報量


Lasso計算結果


MDL(Minimum Description length)による最適化過程


タイタニック生存モデルのLassos最適グラフ構造

Survived 生存有無
Sex 性別
Age 年齢
Friend 同船室
Position 敬称
Rank 乗船等級
Floor 船室階
alone 単独


ベイジアンネットとしての推定

ベイジアンネットによるタイタニック生存率 39.77%


性別を女性に設定


女性である場合のタイタニック生存率 53.63%に上昇




戻る