強化学習/安全な強化学習 のバックアップソース(No.1)

安全な強化学習に関するメモ

*サーベイ論文 [#s1eda9e8]

-[[ García J and Fernández F (2015). A comprehensive survey on safe reinforcement learning. JMLR 16(42):1437–1480.>https://jmlr.org/papers/v16/garcia15a.html]]
--安全な強化学習に関する最初のサーベイ論文


*論文 [#ke1f2355]
-[[Ray A, Achiam J, and Amodei D (2019). Benchmarking safe exploration in deep reinforcement learning. Available from https://openai.com/research/benchmarking-safe-exploration-in-deep-reinforcement-learning>https://openai.com/research/benchmarking-safe-exploration-in-deep-reinforcement-learning]]
--OpenAI Safety Gymに関する論文


*Web [#ncb28416]
-[[chauncygu (2023). Safe reinforcement learning baselines. GitHub [cited at 2023 Dec 19]. Available from https://github.com/chauncygu/Safe-Reinforcement-Learning-Baselines>https://github.com/chauncygu/Safe-Reinforcement-Learning-Baselines]]
--安全な強化学習に関する情報をまとめたGitHubページ



*環境 [#h1b5e37c]
-[[OpenAI (2019). Safety Gym. [cited at 2023 Dec 19]. Available from  https://openai.com/research/safety-gym>https://openai.com/research/safety-gym]]
--OpenAIが開発した安全な強化学習に関するベンチマーク環境
-[[OpenAI (2019). Safety starter agents. GitHub. [cited at 2023 Dec 19]. Available from https://github.com/openai/safety-starter-agents>https://github.com/openai/safety-starter-agents]]
--OpenAIが用意した安全な強化学習エージェント
トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS