マスジョイ

強化学習について

1. 強化学習の基礎

バンディット問題について
バンディット問題の実装
マルコフ決定過程 (MDP)について
ベルマン方程式

2. 様々な手法

モンテカルロ法
TD法
SARSAアルゴリズム
Q学習

3. 方策勾配法

方策勾配法の概要

4. 深層強化学習

DQN

5. 応用例と実装

強化学習の実世界への応用
ゲームAIへの適用
ロボティクスへの適用
トレーディングシステムへの適用

PR

ホームに戻る