コース: データサイエンスの基礎:基本

今すぐコースを受講しましょう

今すぐ登録して、23,200件以上登録されている、業界エキスパート指導のコースを受講しましょう。

教師あり学習、教師なし学習、強化学習

教師あり学習、教師なし学習、強化学習

データサイエンスには 多大な期待がかかることもあります。 時には期待が大きすぎて、 これを魔法か何かと勘違いしているように 思われる場面もあります。 もちろん、データサイエンスに 魔法の道具や精霊の力は 一切関係ありません。 データサイエンスの成果を 導き出しているのは、 アルゴリズムと機械学習です。 アルゴリズムとは、この流れ図のように 判断を並べたものに過ぎませんが、 このようなアルゴリズムがあるからこそ、 機械学習が成立するのです。 機械学習は言ってみれば、 「これが赤なら次のことをしなさい」、 「緑ならこうしなさい」などの 具体的で細かい指示が人の側から 与えられなくても、 データの中にあるパターンを コンピューターのプログラムが 自分で見つけ出す能力のことです。 データサイエンスの中でも、 この機械学習分野の発展は特に重要です。 ここでは、さまざまな種類がある 機械学習を、大まかに次の 3つのカテゴリーに分けて簡単に 紹介します。 1つ目は教師あり学習です。 あらかじめ分類とラベルが決まっていて、 新しい事例をそれぞれに分けていきます。 郵便物を見て、どのメールボックスに 入れるかを判定するようなイメージで、 データサイエンスの中でも、 最も広く普及して、生産性の向上に 貢献している領域です。 教師あり学習は、定義づけされた 結果の予測にも使います。 例えば、血液検査の数値を、 本人の生活習慣のようなさまざまな変数の 組み合わせから予測できるようにする といった使い方です。 このように、分類や結果が 定義づけされているのが特徴です。 教師あり学習は、線形回帰や ロジスティック回帰などの シンプルなものから、ディープラーニング ニューラルネットワークのように 複雑なものまで、 さまざまな手法に利用できます。 2つ目は教師なし学習です。 ここではラベルやスコアを前もって 定義せず、データの類似点を 見つけていくという手法なので、 結果は1通りではありません。 果物の色や形状を見て 似たもの同士をまとめるように、 近いものを集めていきます。 教師なし学習の例が、 各種のクラスタリングや、次元削減です。 次元削減とは、変数すなわち次元が多い データセットをもっと少ない次元に 圧縮することで、データの扱いや 解釈を容易にする手法です。…

目次