コース: データ分析の基礎知識

非構造化データとは

コース: データ分析の基礎知識

非構造化データとは

世の中には、構造化されたデータより、 されていないデータのほうが、 はるかに多く、 構造化データを使って、 さらに非構造化データを生み出しています。 テーブルやスプレッドシートに きちんと収まるデータは、 構造化データで、それ以外はすべて 非構造化データです。 動画の投稿や写真撮影、 クライアントの請求書の PDF 作成などで、 常に膨大な量の非構造化データを 生み出しています。 モバイルデバイスの登場で、 外出中も、パソコンやビデオカメラ、 カメラ、SNS を使い始めたとたん、 爆発的にデータが増えました。 画像を例に考えてみます。 画像は非構造化データです。 画像が何を表しているか理解するには、 画像を見るからです。 動画も同じで、 見なければわかりません。 膨大なデータ量です。 半構造化データもあります。 構造化データと非構造化データが 組み合わさったものです。 親友がビーチで見つけた最高にかわいい 猫の画像をメールしてきたとします。 この画像には、最高にかわいい猫、 少なくとも親友にとっては、 最高にかわいい猫と ビーチが写っています。 データの専門家には、 さらに多くのものが見えます。 私がこの画像を見ると、 猫とビーチ以外が見えるのです。 時刻、天気、場所だけでなく、 猫の種類と色、年齢が見えますし、 PNG などの画像形式、 画像サイズ、 寸法の他、 画質も見えます。 誰かから受け取った情報は、 データだと話しました。 画像を受信した時間もデータで、 誰がいつ撮影したかもデータです。 切りがありません。 最高にかわいい猫から、 あっという前に多くのデータになりました。 多くの人が 画像を SNS に投稿しています。 他の人がその画像を共有し、 転送し、それに「いいね」します。 すべてデータです。 非構造化データは、 脳を使って情報を認識する必要があります。 構造化データは、 きちんと設計されています。 半構造化データは、 その2つの中間のどこかにあります。 所属する組織や提供する商品、 サービスによって、 データを扱うために、必要なツールや ソフトウェアが決まります。 データの構造化、 非構造化がわかれば、 データのさまざまな役割を 理解できます。 データはなくならず、 増える一方です。 以前はミームもありませんでした。 次は何かを考えると、 ワクワクします。

目次