コース: データサイエンスの基礎:基本

今すぐコースを受講しましょう

今すぐ登録して、23,200件以上登録されている、業界エキスパート指導のコースを受講しましょう。

代数について

代数について

データを扱う問題は、 順番に取り組むことができて、 状況がほとんど変化しないという場合、 答えを出すことは それほど難しくありません。 しかし、問題が無数にあって、 激しく変化しながら 解決を迫ってくる場合には、 そう簡単にはいきません。 臨機応変な取り組みが必要となる このような状況で、 頼りになるのが代数の知識です。 データサイエンスにおける代数の重要性は、 大きく2つあります。 まず、どんな規模にも応用がきくことです。 1つの問題に対して作られた解法は、 多くの事例に効率的に 適用することができます。 1回作れば、解法の使い回しがきくのです。 2つ目の重要性も これと密接に関わっていて、 一般化がしやすいということです。 出来上がった解法は、 範囲が限定された特別な事例にしか 通用しないわけではなく、 幅広い違いのあるさまざまな事例に 当てはめることができます。 条件の違いに合わせて無数の解法を 用意しなくてもいいのです。 それではまず、 データサイエンスの基礎となる、 初歩的な代数の知識を 押さえておきましょう。 画面の例は、代数方程式の1つである 線形回帰の方程式です。 代数方程式では、数字に代えて このような文字を使います。 面白いことに、数学やデータと聞くと、 もっぱら数字と格闘しているような イメージを抱いている人が 多いと思うのですが、 実際にわれわれが格闘しているのは 変数なのです。 つまりこの式は変数同士の関係を 表しています。 まずはここを見てください。 一番左にある y は結果です。 下付き文字の i は、 i 番目の事例を意味します。 事例の数は1つ、2つ、百万など、 いくつあっても対応できます。 その次はギリシャ文字で、 小文字のベータです。 下付き文字がゼロになっているのは、 これが y 切片であることを 意味しています。 さまざまな要素を加算する前の 初期値のようなものです。 その次は、またベータが出てきましたが、 今度は下に1がついています。 これは回帰係数といって、 変数 X1 に適用される傾きです。 これが第1の予測変数として、 事例 i の値に乗算されます。 続いて、第2の回帰係数と第2の予測変数、 さらに第3の回帰係数と 第3の予測変数についても、 同様の計算を行います。 そして、最後にあるこの文字は、…

目次