コース: データ分析入門

区切り文字で文字列分割する

コース: データ分析入門

区切り文字で文字列分割する

一つの文字列を 複数の列に分割する方法を理解していると 生産性を向上させることができます。 データの分割や並べ替えは アナリストにとって必須のテクニックです。 ここでは区切り文字で文字列を分割する方法 データを並び変える方法を解説します。 09 フォルダー内の Chapter_09 ファイルを開きます。 利用明細シートをご覧ください。 こちらはビデオを使用している ユーザーの情報が入力されています。 こちらの G 列を見ていただくと、 都道府県と市区名が 一列に入力されています。 これを都道府県と市区名を それぞれ別な列に分けたいと思います。 データの区切り位置機能を使います。 では、G 列を列選択し、 「データ」タブをクリックし、 「区切り位置」をクリックします。 都道府県と市区名は 半角スペースで区切られていますので、 「スペースによって右または左に揃えられた 固定長フィールドのデータ」 こちらにチェックを入れて 「次へ」をクリックします。 このように区切られます。 では「次へ」をクリックします。 都道府県は「文字列」 こちらの市区名も 「文字列」にしておきます。 では「完了」をクリックします。 「既にデータがありますが、 置き換えますか?」という メッセージが出てきます。 「OK」をクリックします。 これで、G 列が都道府県、 H 列が市区名に分けることができました。 では、G1 列を 都道府県に変更しておきましょう。 H 列は市区名に変更します。 このように都道府県と市区名を分けることで 都道府県別や市区ごとに データを集計することが できるようになります。 今度はデータをセッション開始日の 新しい順に並べ替えてみましょう。 セッション開始日の列内をクリックし、 「データ」タブの 「降順」をクリックします。 セッション開始日の新しい順に 並べ替えをすることができました。 区切り位置や並べ替えの機能を知っていると 分析しやすいデータを 作成することができます。 どちらの機能もデータクリーニングには 欠かせない機能です。

目次