更新:2024/11/08

【深層学習】単純パーセプトロンの意味と学習について

$はるか$

はるか

単純パーセプトロンって、知ってる？

$ふゅか$

ふゅか

うん！基本的な分類器で、YesかNo、0か1のように二つのクラスに分けるのに使われるんだよね！

1. 単純パーセプトロンとは？
2. 単純パーセプトロンの仕組み
2.1. 線形結合
2.2. 活性化関数
2.3. 全体の式
3. パーセプトロンの学習
3.1. 重みの更新式
3.2. 更新量
4. 単純パーセプトロンの制約
5. 関連した記事

1. 単純パーセプトロンとは？

単純パーセプトロン（Simple Perceptron）は、人工知能や機械学習において、分類問題のために提唱されたアルゴリズムの一つです。特に、二つのクラス（例：0と1やYesとNo）にデータを分けるために使用される分類器です。

2. 単純パーセプトロンの仕組み

パーセプトロンは、人間の脳の神経細胞（ニューロン）を模したモデルで、入力データに対して重みを適用し、その結果を使ってデータを分類します。以下はその基本的な流れです。

入力層：パーセプトロンには、複数の入力（特徴量）が入ります。
重み：各入力には「重み」という数値が割り当てられます。
バイアス：パーセプトロンには「バイアス」という定数も加えられます。
活性化関数：入力と重みを掛け合わせた合計にバイアスを加えた値を、ある基準に従って出力を決定します。単純パーセプトロンの場合、よく用いられる活性化関数は「ステップ関数」で、合計がある閾値を超えると1、そうでない場合は0と出力します。

$ふゅか$

ふゅか

まず、入力層にデータが入ってくるんだよね。いわゆる特徴量ってやつ！

$はるか$

はるか

特徴量に「重み」がつく。それと「バイアス」も加える。

2.1. 線形結合

単純パーセプトロンでは、まず入力データとそれに対応する重みを掛け合わせ、その合計を計算します。この線形結合の式は以下のように表されます。

\[ z = w_1 x_1 + w_2 x_2 + \dots + w_n x_n + b \]

$ x_1, x_2, \dots, x_n $ : 入力値（特徴量）
$ w_1, w_2, \dots, w_n $ : 各入力に対する重み
$ b $ : バイアス項
$ z $ : 線形結合の結果

この式は、すべての入力と重みの積の合計にバイアスを加えたものです。

$はるか$

はるか

閾値を超えたら1、そうじゃなければ0。

$ふゅか$

ふゅか

シンプルだけど、ちゃんと分類できるんだね！

2.2. 活性化関数

活性化関数として「ステップ関数」を用いると

\[ y = \begin{cases} 1 & \text{if } z \geq 0 \\ 0 & \text{if } z < 0 \end{cases} \]

$ y $ : パーセプトロンの最終出力

2.3. 全体の式

これらを組み合わせた単純パーセプトロンの出力は、以下のように表せます。

\[ y = \begin{cases} 1 & \left( \displaystyle\sum_{i=1}^{n} w_i x_i + b \geq 0 \right) \\ 0 & \left( \displaystyle\sum_{i=1}^{n} w_i x_i + b < 0 \right) \end{cases} \]

この数式によって、単純パーセプトロンは入力データが閾値を超えているかどうかに基づいて、1か0を出力する二値分類を行います。

3. パーセプトロンの学習

3.1. 重みの更新式

各重み $ w_i $ の更新は以下の式で行われます。

\[ w_i \leftarrow w_i + \Delta w_i \]

3.2. 更新量

更新量 $ \Delta w_i $ は以下のように定義されます。

\[ \Delta w_i = \eta (y_{\text{target}} – y_{\text{output}}) x_i \]

$ w_i $ : 重み（更新前）
$ \eta $ : 学習率（小さい正の値で、更新の大きさを調整するパラメータ）
$ y_{\text{target}} $ : 目標の出力（正解ラベル）
$ y_{\text{output}} $ : パーセプトロンの出力（予測値）
$ x_i $ : 対応する入力値

4. 単純パーセプトロンの制約

単純パーセプトロンは基本的なモデルですが、いくつかの制約もあります。特に、データが線形分離可能な場合にしか正確な分類ができません。

$はるか$

はるか

制約もある。線形分離できないデータには使えない。

5. 関連した記事

ホームに戻る

【深層学習】単純パーセプトロンの意味と学習について

1. 単純パーセプトロンとは？

2. 単純パーセプトロンの仕組み

2.1. 線形結合

2.2. 活性化関数

2.3. 全体の式

3. パーセプトロンの学習

3.1. 重みの更新式

3.2. 更新量

4. 単純パーセプトロンの制約

5. 関連した記事

ValueError: The checkpoint you are trying to load has model type `gemma2` but Transformers does not recognize this architecture.の解決方法！gemma2の読み込み

【深層学習】活性化関数と非線形関数の意味について

【機械学習】教師なし学習とは？主な手法と特徴、応用例について

【PyTorch】MNISTを学習させて手書き文字認識、画像分類を行う方法

【scikit-learn】決定木による分類の意味と使い方について