Excelでのテキストデータのクリーニング・チュートリアル
このチュートリアルは、XLSTATソフトウェアを用いてExcel内で、テキスト・データからスペース除去、スペース重複の修正、またはテキストの置換を行う方法を説明します。
データセット
データと結果のExcelシートは、上のリンクからダウンロードできます。
データセットは、調査に対する回答を表す2個の順序カテゴリ変数を含みます。
我々の目的は回答をクリーンアップすることです。単語の前、後、または間のスペース(複数)を除去したり、99をunknownに置換したりするために、XLSTATのテキスト・データのクリーニング・ツールを使用します。
XLSTATでのテキスト・データのクリーニングのセットアップ
XLSTATメニューで、テキスト・マイニング/テキストデータのクリーニング コマンドを選択してください:
テキスト・データのクリーニング ダイアログ・ボックスが現れます:
一般タブで、データフィールドに列AとBを選択します。 ワード間のスペースの最大数を 1にします。置換フィールドの下で、99の値をunknown に置換するように入れます。
OK ボタンをクリックすると、出力シートが生成されます。
テキスト・データのクリーニングの結果
Trim spacesという名前の新しいシートが表示されて、クリーンなテキスト・データを格納しています(下図)。

Was this article useful?
- Yes
- No