コース: データ分析入門

手元にないデータを扱う

コース: データ分析入門

手元にないデータを扱う

データを分析しようにも、 必要なデータが不足している場合は、 どのように対処しますか? 理想的なのは、 必要なすべてのデータが どこかに保存されていて、 それにアクセスするだけで済む状態です。 もし必要なデータが欠落している場合は、 どうすればよいでしょう。 多くの場合、関数や数式を使って データを計算することができます。 システムに登録されていないデータも、 計算して求めることができます。 計算結果は、個別に保存せず、 画面表示やレポート作成の時に 計算すればよいわけです。 まずは、求めたいデータを導き出す 数式や関数を習得する必要があります。 データ分析に必要な指標を計算する時の 公式的な数式の習得や、 データ分析に必要な関数を習得します。 その多くは、データアナリストとしての 仕事の過程で学ぶことになるでしょう。 もちろん、基本的な算術演算である、 足し算、引き算、掛け算、割り算を、 まず確実に理解します。 また文字列を結合する CONCATENATE 関数や、 条件を指定できる IF 関数や、AND 関数、OR 関数、 さらに CASE ステートメントなど 知ることも役に立ちます。 CONCATENATE 関数の 使い方を学ぶことで、 複数の項目を結び付け、 ひとつの文字列にすることができます。 例えば、都道府県の項目と 市区名の項目を作成します。 これは通常、都道府県で並べ替えたり、 都道府県別に集計することができるため、 項目を分けておくと、非常に便利です。 そして、住所として利用する場合は、 CONCATENATE 関数を使って、 複数の項目を結合します。 次に、IF 関数や IF 文を使うと、 条件に応じた結果を返すことができます。 IF 関数や、IF 文は、 条件によって得られる結果を 変えることができます。 その構成は、条件式、 条件が YES のときの処理、 NO のときの処理を指定します。 IF 文はとても便利ですから、 関数だけでなく、 多くの言語で利用されます。 さらに、関数や数式で利用されるデータは、 保存形式に注意する必要があります。 数値として計算に使用したいデータが 文字列として保存されている場合などです。 その場合、数式や関数で利用できるよう 変換しなければいけません。 変換に使用する数式、関数を 習得する必要があります。 ほとんどのデータは、 データ型を変換することができます。 また、数値や日付を使った計算ができます。 それぞれ、数値は数値型、 日付は日付型のデータ形式に なっていることが望ましいですが、 もし違う場合でも、 簡単な処理で変換できます。 例えば、数値や文字列として 保存されている日付は、 計算に使用することができません。 日付型のデータに変換してから 使う必要があります。 同様に、文字列で保存されている金額も、 計算に利用できません。 数値型や通貨に変換してから 使う必要があります。 それではここで、 Excel ファイルを開き、 具体的な例を見てみましょう。 「Chapter_02」を開きます。 CONCATENATE の シートを開きましょう。 各列に入力された都道府県、 地区名、他を使い、 住所を表示する数式を作ります。 E2 セルをクリックし、 半角で = をタイプし、 アルファベット con です。 下向き矢印で CONCATENATE を選択し、 Tab キーで確定します。 B2 セルをクリックし、 半角カンマを入力、 続いて C2 セルをクリックし、 半角カンマを入力。 D2 セルをクリックし、 括弧閉じるを入力し、 Enter で式を確定します。 住所を繋げて表示することができます。 では、E2 セルをクリックし、 右下にマウスを合わせ、 ダブルクリックで式をコピーしましょう。 続いて今度は IF、 こちらのシートを開きます。 各動画の受講者情報が入力されています。 E 列の「視聴日」を基に、 視聴済みのフラグを IF 関数で追加します。 ロジックは、E 列が空欄なら0、 それ以外は1を入力します。 では、F2 セルをクリックし、 半角で = を入力し、 アルファベット I、F です。 Tab キーで関数を確定します。 E2 セルをクリックし、 =、 ダブルクォーテーションを2回です。 半角カンマを入力し、 数字の0、 半角カンマを入力し、 数字の1、 括弧閉じるを入力し、 Enter で式を確定します。 では、F2 セルをクリックし、 右下にマウスを合わせ、 ダブルクリックで式をコピーしましょう。 8行目は視聴日が空欄になっていますので、 視聴済みは、0と表示されています。 最後は「変換」のシートを開きましょう。 観葉植物の売上一覧表です。 I 列の「金額」、 これを見ると、 エラーオプションが表示されています。 メッセージを確認すると、 「数値が文字列として保存されています」と 表示されています。 このままでは計算に使えませんので、 数値型に変える必要があります。 では、エラーオプションの メッセージを使って、 データ型を数値型に変更します。 I2 セルから I20 までを範囲選択し、 エラーオプションをクリックし、 上から2番目、 「数値に変換する」をクリックします。 これで数値型に変更することができました。 このように、 足りないデータを数式で補ったり、 必要に応じてデータ型を変換し、 分析に利用しましょう。

目次