強化学習/複利型強化学習 のバックアップ差分(No.1)


  • 追加された行はこの色です。
  • 削除された行はこの色です。
*はじめに [#jb47d94c]
複利型強化学習はリターン型MDPにおいて複利リターンを最大化する強化学習の枠組みです.

まずは複利型強化学習について発表した論文と,その関連研究をここにまとめていきます.

*発表論文 [#db87a978]
-''[[Compound Reinforcement Learning: Theory and An Application to Finance:http://ewrl.files.wordpress.com/2011/08/ewrl2011_submission_33.pdf]]''. Tohgoroh Matsui, Takashi Goto, Kiyoshi Izumi and Yu Chen.  EWRL9 (2011).
-''[[複利型強化学習:http://www.jstage.jst.go.jp/article/tjsai/26/2/26_330/_article/-char/ja/]]''.  松井藤五郎.  人工知能学会論文誌, Vol. 26, No. 2, pp. 330-334 (2011).

トップ   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS