強化学習/複利型強化学習のバックアップ差分(No.1)

バックアップ一覧
現在との差分を表示
ソースを表示
バックアップを表示
強化学習/複利型強化学習へ行く。
- 1 (2011-09-15 (木) 16:49:13)
- 2 (2011-09-21 (水) 12:36:33)

追加された行はこの色です。
削除された行はこの色です。

*はじめに [#jb47d94c]
複利型強化学習はリターン型MDPにおいて複利リターンを最大化する強化学習の枠組みです．

まずは複利型強化学習について発表した論文と，その関連研究をここにまとめていきます．

*発表論文 [#db87a978]
-''[[Compound Reinforcement Learning: Theory and An Application to Finance:http://ewrl.files.wordpress.com/2011/08/ewrl2011_submission_33.pdf]]''. Tohgoroh Matsui, Takashi Goto, Kiyoshi Izumi and Yu Chen.  EWRL9 (2011).
-''[[複利型強化学習:http://www.jstage.jst.go.jp/article/tjsai/26/2/26_330/_article/-char/ja/]]''.  松井藤五郎.  人工知能学会論文誌, Vol. 26, No. 2, pp. 330-334 (2011).

強化学習/複利型強化学習 のバックアップ差分(No.1)

強化学習/複利型強化学習のバックアップ差分(No.1)