更新:2024/10/27

【深層学習】ReLU（Rectified Linear Unit、ランプ関数）の意味と性質について

$はるか$

はるか

ReLUは、入力がゼロ未満だとゼロにするだけ。ゼロ以上ならそのまま。

$ふゅか$

ふゅか

なるほど！簡単に言うと、負の数はカットして、正の数だけ通すってことね！ハイパスフィルタみたいね！

1. ReLU（Rectified Linear Unit）とは
1.1. 定義
1.2. 名称
1.3. 用途
2. グラフでのイメージ
3. ReLU関数の微分
4. ReLUの派生
4.1. Leaky ReLU（リーキーReLU）
4.2. Exponential Linear Unit（ELU, 指数線形単位）
5. 関連した記事

1. ReLU（Rectified Linear Unit）とは

1.1. 定義

ReLU（Rectified Linear Unit）は、入力値がゼロ未満のときはゼロを出力し、ゼロ以上のときはその入力値をそのまま出力する関数です。

\[ f(x) = \max(0, x) \]

これは

x < 0 の場合：$f(x) = 0$
x >= 0 の場合：$f(x) = x$

を意味します。これは、次のようにも表すことができます。

\[ f(x) = \begin{cases} 0 &( x<0 ) \\ x &( x\geq 0) \end{cases}\]

また、絶対値を利用して次のように表すことができます。

\[ f(x) = \frac{x+|x|}{2}\]

このように、ReLUは負の入力をゼロにし、正の入力はそのまま通すという動作をします。ランプ関数とReLU（Rectified Linear Unit）は数学的に同じであり、負の入力をゼロにし、正の入力をそのまま通します。

1.2. 名称

ReLUは「Rectified Linear Unit」の略称で次のように呼ばれることがあります。

ランプ関数
正規化線形関数

1.3. 用途

ReLUはディープラーニングのニューラルネットワークで主に使用され、各層の出力を調整する「活性化関数」として働きます。特に、ReLUの特徴は「勾配消失問題（gradient vanishing problem）」と呼ばれる問題を回避しやすいことです。ニューラルネットワークの学習で、負の入力をゼロにし、正の入力のみを通すことで、信号を次の層に適切に伝えやすくします。

2. グラフでのイメージ

ReLU（Rectified Linear Unit）のグラフは、x軸の負の部分では常にゼロの高さにあり、x軸の正の部分では45度の直線として上昇します。

x ≤ 0：出力は常に0になります。したがって、グラフはx軸上に水平な線として描かれます。
x > 0：出力はxの値と等しいので、グラフは45度の直線（y = x）として描かれます。

3. ReLU関数の微分

ReLU関数を微分した結果は以下の通りです。

\[ f'(x) = \begin{cases} 0 & (x < 0) \\ 1 & ( x \geq 0) \end{cases} \]

4. ReLUの派生

ReLU（Rectified Linear Unit）は、ニューラルネットワークで広く使われている活性化関数で、その派生としていくつかの重要なバリエーションが提案されています。

4.1. Leaky ReLU（リーキーReLU）

Leaky ReLUは、ReLUが持つ「ニューロンが死んでしまう」という問題に対処するために開発されました。通常のReLUでは、入力が負の値になると出力がゼロになり、これが原因で「ニューロンが死んでしまう」問題が生じることがあります。Leaky ReLUは、負の入力に対して小さな傾きを持たせ、少しだけ負の出力を許容します。数式で表すと以下のようになります。

\[ f(x) = \begin{cases} x &( x\geq 0 ) \\ \alpha x & ( x<0 ) \end{cases} \]

ここで、$\alpha$ は小さな正の定数（通常0.01）です。

$はるか$

はるか

Leaky ReLUもある。負の値に少しだけ傾きをつける。

$ふゅか$

ふゅか

そうそう！Leaky ReLUは、ニューロンが「死んじゃう」のを防ぐためなんだよね！普通のReLUだと、ゼロにしちゃうから動かなくなるけど、Leaky ReLUなら少しだけ負の出力を許してくれる！