強化学習

2023-12-21 (木) 18:18:25 (571d) | Topic path: Top / 強化学習 / 強化学習

強化学習の勉強を始める人のためのメモ

教科書 †

Sutton R and Barto A (2022). 強化学習, 第2版. 奥村, 鈴木, 松尾他監訳, 今井, 川尻, 菊池他訳. 森北出版. 978-4-627-82662-5
- バイブル的教科書の第2版
- 英語版はここで無料で読める。

森村哲郎 (2019). 強化学習. 講談社サイエンティフィック. 978-4-06-515591-2
- 講談社サイエンティフィックの機械学習プロフェッショナルシリーズの1冊として書かれた本

牧野, 澁谷, 白川 (2016). これからの強化学習. 浅田, 麻生, 荒井他著. 森北出版. 978-4-627-88031-3
- Suttonの教科書第2版が出版される前に書かれた、計測と制御（計測自動制御学会誌）のリレー連載を書籍化したもの

解説 †

森村哲郎 (2022). 強化学習一般. 人工知能 37(4):455–463. doi: 10.11517/jjsai.37.4_455
池本隼也, 潮俊光 (2019). 深層ニューラルネットワークを利用した強化学習の制御への応用. 日本神経回路学会誌 26(4):135–144. doi: 10.3902/jnns.26.135
- 深層強化学習の解説
計測と制御（計測自動制御学会誌）のリレー解説
浅田稔 (2021). ロボティクスと強化学習. 日本ロボット学会誌 39(7):575–580. doi: 10.7210/jrsj.39.575
- 強化学習のロボット制御への応用に関する解説
福井啓, 河本献太 (2021). ロボット移動技術と強化学習. 日本ロボット学会誌 39(7):605–608. doi:10.7210/jrsj.39.605
- 強化学習の移動ロボットへの応用に関する解説

コード †

Gymnasium
- 強化学習の環境
- OpenAI Gymの後継プロジェクト
Stable-Baselines3
- Gymnasium用深層強化学習アルゴリズム
- TensorFlowで書かれていたStable-BaselinesをPyTorchで書き直したもの
私がColaboratoryで書いたサンプル・コード

とうごろう.jp

とうごろぐ（ブログ）

Twitter

Facebook

授業

最新の20件

2025-06-28

Tips For Online Dating Website No Cost

2025-05-12

機械学習/Rで機械学習する

2025-01-11

ColabでCUDAとPyTorchとPythonをダウングレードする

2024-10-02

バイオ・データ・マイニング/ClustalWでペアワイズ・アラインメントを行う

2024-08-06

2023-12-26

金融データ・マイニング/動的クラスタリングとクラスター変化検出

2023-12-22

強化学習/安全な強化学習

2023-12-21

2023-12-19

授業/情報数学

2023-01-11

バイオ・データ・マイニング/Rでロジスティック回帰を使う

2022-11-09

2022-10-14

バイオ・データ・マイニング/HMMERで相同性検索を行う

2020-12-23

バイオ・データ・マイニング/Rで回帰分析する

2020-12-09

バイオ・データ・マイニング/Rで階層クラスタリングを使う

2020-10-21

バイオ・データ・マイニング/BLASTで相同性検索を行う