ExcelでのEMアルゴリズムを用いた欠損値の補完
このチュートリアルは、XLSTATソフトウェアによりEMT(Expectation Maximization) アルゴリズムを用いて欠損値を補完 する方法を示します。
EMアルゴリズムで欠損データを補完するデータセット
EMアルゴリズムによる欠損値の補完を説明するために使用するデータセットは、欠損値をランダムに導入した有名なFisherのirisデータセットです。
XLSTATでの欠損値補完のセットアップ
XLSTAT/ データ準備 / 欠損値 機能を下記のように選択してください:

欠損値ダイアログ・ボックスが現れます。

量的データ・フィールドで、欠損値をランダムに導入したデータセットに対応する列 H から K を選択してください。欠損値を EMアルゴリズムを用いて推定するように選んでください。OK ボタンをクリックすると、計算が始まり結果が表示されます。
XLSTATでのEM補完プロセスの結果
欠損値を表すチャートが赤色で表示されます。 データ構造には特別なパターンはありません。

補完の前と後の記述統計が続きます。

最後に、最初に欠損値だったデータを太字にして完全なデータセットを提供します。

補完されたデータ(上表)と欠損値のないオリジナルのデータセット(下表)を比較すると、補完された値が真の値に近いことがわかります。たとえば、最初のオブザベーションで33の代わりに32.8を得ています。したがって、この手法は平均への置換などの他のタイプの補完の場合よりもかなり有用です。

Was this article useful?
- Yes
- No