メインコンテンツに移動

Excelでのテキストデータのクリーニング・チュートリアル

このチュートリアルは、XLSTATソフトウェアを用いてExcel内で、テキスト・データからスペース除去スペース重複の修正、またはテキストの置換を行う方法を説明します。

データセット

データと結果のExcelシートは、上のリンクからダウンロードできます。

データセットは、調査に対する回答を表す2個の順序カテゴリ変数を含みます。 我々の目的は回答をクリーンアップすることです。単語の前、後、または間のスペース(複数)を除去したり、99をunknownに置換したりするために、XLSTATのテキスト・データのクリーニング・ツールを使用します。

XLSTATでのテキスト・データのクリーニングのセットアップ

XLSTATメニューで、テキスト・マイニング/テキストデータのクリーニング コマンドを選択してください: テキスト・データのクリーニング ダイアログ・ボックスが現れます: 一般タブで、データフィールドに列AとBを選択します。 ワード間のスペースの最大数を 1にします。置換フィールドの下で、99の値をunknown に置換するように入れます。

OK ボタンをクリックすると、出力シートが生成されます。

テキスト・データのクリーニングの結果

Trim spacesという名前の新しいシートが表示されて、クリーンなテキスト・データを格納しています(下図)。

Was this article useful?

  • Yes
  • No