コース: ビッグデータの基礎:手法と概念

今すぐコースを受講しましょう

今すぐ登録して、23,100件以上登録されている、業界エキスパート指導のコースを受講しましょう。

個人生成データについて

個人生成データについて

ビッグデータの情報には、 個人生成データと、 機械生成データがあります。 人は意図的または無意識に、膨大なデータを 日々生成しています。 意図的なデータとは、 人が記録する写真や動画、音声、 SNS 上のテキストなど、 意識的に生成しているデータのことで、 Facebook の「いいね」や、 ネット検索や閲覧したウェブページ、 そしてそのブックマーク、 Eメールやテキストメッセージ、通話、 電子書籍のメモやハイライト、 オンラインの買い物、 これらはすべて、本人が意図して それを実行しなければ存在しないものです。 人の行動の記録とも言えます。 興味深いのは、意図的なデータに 付随して生まれるメタデータです。 データについてのデータであり、 私が独自に分類名を考えるとするなら、 2次の個人生成データです。 人が記録するデータに付随していても、 通常は意識されることがないメタデータは、 量が多く、人が記録したデータより 膨大になることもあります。 もっと重要なのは、 コンピューターが生成するため、 機械による読み取りや 検索も可能になっている点です。 メタデータの情報と活用法について、 例を使って説明します。 わかりやすいのが写真です。 スマートフォンで写真を撮ると、 Exif データが生成されます。 Exif は写真用のファイル形式で、 この例のようなメタデータを含んでいます。 左側にはファイル名や 3.1MB の ファイルサイズ、撮影日時などがあり、 右側には GPS の海抜高度や緯度、 経度、GPS 画像の方向など、 つまりカメラの向きまで記録されています。 このように、 撮影した写真には、 非常に多くの情報が付属しています。 携帯での通話にもメタデータがあります。 このデータは原則非公開なので、 あくまで参考情報ですが、 通話をすると膨大な情報が記録されて、 通話相手や会話の内容がわからなくても、 日時と場所という2種類の情報から 驚くほど多くのことがわかります。 匿名化されたデータの中に通話4件分の 日時と場所が含まれていれば、 それだけで 95%の個人が 特定できてしまいます。 非公開の情報という点は 改めて強調したいと思いますが、 メタデータからは これだけのことがわかります。 次はEメールのメタデータです。 Eメールには多くの情報が含まれますが、…

目次