コース: ビッグデータの基礎:手法と概念

今すぐコースを受講しましょう

今すぐ登録して、23,100件以上登録されている、業界エキスパート指導のコースを受講しましょう。

構造化データについて

構造化データについて

構造化データは、フィールドや 変数の位置が決まっています。 その代表例がスプレッドシートで、 各列に変数、各行に事例が入ります。 大量のデータはデータベースに 保存されます。 一般に用いられるのは、 スプレッドシートと同様の行と列を、 より大容量で柔軟に使えるようにした、 リレーショナルデータベースです。 ある調査では、データベース利用者全体の 約8割が使っており、人気上位は Microsoft SQL Server、 MySQL、Oracle でした。 ここで、SQL データベースの歴史を 簡単に説明しましょう。 1970 年代初め、IBM が開発した SEQUEL 言語についての論文が 発表されました。 その後、名前の綴りは著作権の関係で SQL に変更されましたが、 IBM では製品化されませんでした。 初の製品化はオラクルの前身企業で、 70 年代後半でした。 同社は今も最大手の一角です。 設立者のラリー・エリソンも、 世界有数の資産家になっています。 SQL はデータの抽出や集計、 並べ替え、データセットの結合、 データ更新と追加が簡単にできます。 操作はすべて言語化され、 マウスのクリックや範囲選択が不要です。 たとえば、大学の学生情報データベースから 性別や学部、学科、専攻を抽出する SQL コマンドはこのようになります。 SELECT という機能に続けて、 抽出する変数を並べます。 FROM 機能で、 抽出元とするテーブルを指定します。 さらに WHERE 機能を使うと、 25 歳以上といった細かい条件を 指定できます。 1つの文になっているのが特徴で、 この例では、SELECT に続けて 4変数を書き、 FROM に続けてテーブル名、 WHERE に続けて条件式を書いて、 最後にセミコロンです。 続いては、非構造化、半構造化データと NoSQL データベースについて 解説します。

目次