強化学習/強化学習
をテンプレートにして作成
開始行:
強化学習の勉強を始める人のためのメモ
*教科書 [#u5da4bbd]
-[[Sutton R and Barto A (2022). ''強化学習'', 第2版. 奥村...
--バイブル的教科書の第2版
--英語版は[[ここ>http://incompleteideas.net/book/the-book...
#html{{
<a href="https://www.amazon.co.jp/%E5%BC%B7%E5%8C%96%E5%A...
}}
-[[森村 哲郎 (2019). ''強化学習''. 講談社サイエンティフィ...
--講談社サイエンティフィックの[[機械学習プロフェッショナ...
#html{{
<a href="https://www.amazon.co.jp/%E5%BC%B7%E5%8C%96%E5%A...
}}
-[[牧野, 澁谷, 白川 (2016). ''これからの強化学習''. 浅田,...
--Suttonの教科書第2版が出版される前に書かれた、計測と制御...
#html{{
<a href="https://www.amazon.co.jp/%E3%81%93%E3%82%8C%E3%8...
}}
*解説 [#n50d1519]
-[[森村 哲郎 (2022). ''強化学習一般''. 人工知能 37(4):455...
-[[池本 隼也, 潮 俊光 (2019). ''深層ニューラルネットワー...
--深層強化学習の解説
-計測と制御(計測自動制御学会誌)のリレー解説
++[[木村 元 (2013). ''強化学習の基礎''. 計測と制御 52(1):...
++[[牧野 貴樹 (2013). ''探索と利用のトレードオフとベイズ...
++[[植野 剛, 前田 新一, 川鍋 一晃 (2013). ''統計学習の観...
++[[澁谷 長史 (2013). ''部分観測マルコフ決定過程と強化学...
-[[浅田 稔 (2021). ''ロボティクスと強化学習''. 日本ロボッ...
--強化学習のロボット制御への応用に関する解説
-[[福井 啓, 河本 献太 (2021). ''ロボット移動技術と強化学...
--強化学習の移動ロボットへの応用に関する解説
*コード [#i0ed6d60]
-[[''Gymnasium''>https://gymnasium.farama.org/]]
--強化学習の環境
--OpenAI Gymの後継プロジェクト
-[[''Stable-Baselines3''>https://stable-baselines3.readth...
--Gymnasium用深層強化学習アルゴリズム
--TensorFlowで書かれていたStable-BaselinesをPyTorchで書き...
-私がColaboratoryで書いたサンプル・コード
--[[DQN で Mountain Car>https://colab.research.google.com...
--[[DQN で Lunar Lander>https://colab.research.google.com...
--[[PPO で Breakout>https://colab.research.google.com/dri...
--[[PPO で Ms. Packman>https://colab.research.google.com/...
終了行:
強化学習の勉強を始める人のためのメモ
*教科書 [#u5da4bbd]
-[[Sutton R and Barto A (2022). ''強化学習'', 第2版. 奥村...
--バイブル的教科書の第2版
--英語版は[[ここ>http://incompleteideas.net/book/the-book...
#html{{
<a href="https://www.amazon.co.jp/%E5%BC%B7%E5%8C%96%E5%A...
}}
-[[森村 哲郎 (2019). ''強化学習''. 講談社サイエンティフィ...
--講談社サイエンティフィックの[[機械学習プロフェッショナ...
#html{{
<a href="https://www.amazon.co.jp/%E5%BC%B7%E5%8C%96%E5%A...
}}
-[[牧野, 澁谷, 白川 (2016). ''これからの強化学習''. 浅田,...
--Suttonの教科書第2版が出版される前に書かれた、計測と制御...
#html{{
<a href="https://www.amazon.co.jp/%E3%81%93%E3%82%8C%E3%8...
}}
*解説 [#n50d1519]
-[[森村 哲郎 (2022). ''強化学習一般''. 人工知能 37(4):455...
-[[池本 隼也, 潮 俊光 (2019). ''深層ニューラルネットワー...
--深層強化学習の解説
-計測と制御(計測自動制御学会誌)のリレー解説
++[[木村 元 (2013). ''強化学習の基礎''. 計測と制御 52(1):...
++[[牧野 貴樹 (2013). ''探索と利用のトレードオフとベイズ...
++[[植野 剛, 前田 新一, 川鍋 一晃 (2013). ''統計学習の観...
++[[澁谷 長史 (2013). ''部分観測マルコフ決定過程と強化学...
-[[浅田 稔 (2021). ''ロボティクスと強化学習''. 日本ロボッ...
--強化学習のロボット制御への応用に関する解説
-[[福井 啓, 河本 献太 (2021). ''ロボット移動技術と強化学...
--強化学習の移動ロボットへの応用に関する解説
*コード [#i0ed6d60]
-[[''Gymnasium''>https://gymnasium.farama.org/]]
--強化学習の環境
--OpenAI Gymの後継プロジェクト
-[[''Stable-Baselines3''>https://stable-baselines3.readth...
--Gymnasium用深層強化学習アルゴリズム
--TensorFlowで書かれていたStable-BaselinesをPyTorchで書き...
-私がColaboratoryで書いたサンプル・コード
--[[DQN で Mountain Car>https://colab.research.google.com...
--[[DQN で Lunar Lander>https://colab.research.google.com...
--[[PPO で Breakout>https://colab.research.google.com/dri...
--[[PPO で Ms. Packman>https://colab.research.google.com/...
ページ名: