- バックアップ一覧
- 差分 を表示
- 現在との差分 を表示
- ソース を表示
- 強化学習/強化学習 へ行く。
- 1 (2023-12-20 (水) 09:16:44)
- 2 (2023-12-20 (水) 09:27:53)
- 3 (2023-12-21 (木) 11:17:40)
強化学習の勉強を始める人のためのメモ
解説 †
- 池本 隼也, 潮 俊光 (2019). 深層ニューラルネットワークを利用した強化学習の制御への応用. 日本神経回路学会誌 26(4):135–144. https://doi.org/10.3902/jnns.26.135
- 深層強化学習の解説
- 計測と制御 リレー解説
- 木村 元 (2013). 強化学習の基礎. 計測と制御 52(1):72–77. https://doi.org/10.11499/sicejl.52.72
- 牧野 貴樹 (2013). 探索と利用のトレードオフとベイズ環境モデル. 計測と制御 52(2):154–161. https://doi.org/10.11499/sicejl.52.154
- 植野 剛, 前田 新一, 川鍋 一晃 (2013). 統計学習の観点から見たTD学習. 計測と制御 52(3):277–283. https://doi.org/10.11499/sicejl.52.277
- 澁谷 長史 (2013). 部分観測マルコフ決定過程と強化学習. 計測と制御 52(4):374–380. https://doi.org/10.11499/sicejl.52.374
コード †
- Gymnasium
- 強化学習の環境
- OpenAI Gymの後継プロジェクト
- Stable-Baselines3
- Gymnasium用深層強化学習アルゴリズム
- TensorFlowで書かれていたStable-BaselinesをPyTorchで書き直したもの
- 私がColaboratoryで書いたサンプル・コード