更新:2024/10/27

【深層学習】Dying ReLU問題とReLU（Rectified Linear Unit）について

$はるか$

はるか

ReLU関数は、0より大きいとそのまま値を出すだけ。

1. ReLU関数の特徴
2. Dying ReLU問題とは？
2.1. Leaky ReLU（リーキ・リル）
3. 関連した記事

1. ReLU関数の特徴

まず、ReLU関数は以下のように定義されます。

\[ f(x) = \max(0, x) \]

この関数は、入力が正（0より大きい）であればその値を出力し、負であれば0を出力します。これにより、ニューラルネットワークの学習を高速化し、勾配消失問題（勾配がどんどん小さくなり、最適化が進まない問題）を回避しやすくするという利点があります。

2. Dying ReLU問題とは？

「Dying ReLU」問題とは、ディープラーニングにおいてよく使用される「ReLU（Rectified Linear Unit）」という活性化関数が引き起こす問題のことです。ReLUはそのシンプルさと計算の効率から、数多くのニューラルネットワークで利用されています。しかし、学習の過程で一部のニューロンが全く活動しなくなり、以降もそのニューロンが出力ゼロのまま固定されて、まったく信号が伝播されないということがあるのです。これが「Dying ReLU問題」です。特に学習率が高いと、この問題が発生しやすくなります。