コース: データサイエンスの基礎:基本

今すぐコースを受講しましょう

今すぐ登録して、23,200件以上登録されている、業界エキスパート指導のコースを受講しましょう。

データの新規収集

データの新規収集

どこにもないデータが 必要になることもあるでしょう。 社内データ、オープンデータ、 API などのさまざまな情報源に加えて、 データスクレイピングという 手段を使っても、 重要な問いへの答えを出すために 必要なデータが得られないとなれば、 DIY(ディーアイワイ)的に自分で データを集めるコースを 選ぶことになります。 集め方はいろいろあります。 私がまず薦めたい方法は、自然な観察です。 今いる部屋から外に出て、 人々の姿に目を向けます。 現実の世界やオンラインで 起きていることを見つめ、 調べたいトピックについて どんなことが語られているかを把握します。 新たなデータを集める場合に まずやっておきたい効果的な方法は、 ひたすら観察することです。 この観察をある程度続けたら、 潜在顧客などへの 予備的な聞き取り調査に進みます。 1対1で行ったり、 フォーカスグループ形式で行ったり、 オンラインのメールやチャットを 使ったりします。 この段階では、プロジェクトに必要な 情報を集めるための 具体的な質問を行います。 それが完了したら、 次は正式な面談調査に進みます。 この段階では、プロジェクトで 明らかにしたい事柄を具体的に絞り込んだ 質問一式を用意して、潜在顧客などから 直接回答を聞き取ります。 さらに進んで、アンケート調査による データ収集という方法もあります。 ここでは、回答の選択肢が あらかじめ決まっていて、 「非常によい」「よい」といった 評価を尋ねたり、 「これを薦めますか」という質問に 「はい」か「いいえ」で 答えてもらったりします。 ただし、回答の選択肢を絞るためには、 事前に十分な情報収集と検討を行って 想定される回答の範囲を 把握しておくことが必要です。 準備不足のまま先を急がないよう 気をつけましょう。 特に予備調査で言えることですが、 すべての段階に共通する 重要な原則があります。 それは、言葉は数字よりも 優るということです。 人々の経験について知りたいなら、 できる限り自由に 回答してもらうようにしましょう。 まずはそれぞれの言葉で 表現してもらいます。 選択肢を絞って、それぞれの回答を それぞれ何人が選んだかを数えていくのは、 もっと後でいいのです。 まずすべきことは、人々にできるだけ 自由な言葉で表現してもらうことなのです。…

目次