複利型強化学習

| Topic path: Top / 強化学習 / 複利型強化学習

*はじめに [#jb47d94c]
複利型強化学習はリターン型MDPにおいて複利リターンを最大化する強化学習の枠組みです.

まずは複利型強化学習について発表した論文と,その関連研究をここにまとめていきます.

*発表論文 [#db87a978]
**代表的論文 [#s9ccf903]
-''[[Compound Reinforcement Learning: Theory and An Application to Finance:http://ewrl.files.wordpress.com/2011/08/ewrl2011_submission_33.pdf]]''. Tohgoroh Matsui, Takashi Goto, Kiyoshi Izumi and Yu Chen.  EWRL9 (2011).
**主な論文 [#s9ccf903]
-''複利型強化学習の理論と応用''.  松井藤五郎, 後藤卓, 和泉潔, 陳ユ.  情報処理学会論文誌, Vol. 52, No. 12 (to appear).
-''[[Compound Reinforcement Learning: Theory and An Application to Finance:http://ewrl.files.wordpress.com/2011/08/ewrl2011_submission_33.pdf]]''. Tohgoroh Matsui, Takashi Goto, Kiyoshi Izumi and Yu Chen.  European Workshop on Reinforcement Learning (EWRL9) (2011).  2011年9月, アテネ.
-''[[複利型強化学習:http://www.jstage.jst.go.jp/article/tjsai/26/2/26_330/_article/-char/ja/]]''.  松井藤五郎.  人工知能学会論文誌, Vol. 26, No. 2, pp. 330-334 (2011).

**その他 [#c7dfbed1]
-''複利型強化学習を用いた国債銘柄選択''. 松井藤五郎, 後藤卓, 和泉潔, 陳昱. 2011年度人工知能学会全国大会 JSAI 2011, 2H1-OS18-4 (2011). 2011年6月, アイーナ, 盛岡.
-''複利型強化学習を用いた国債の金利とデフォルト確率に基づく銘柄選択''. 松井藤五郎, 後藤卓, 和泉潔, 陳昱, 第5回ファイナンスにおける人工知能応用研究会(SIG-FIN), pp. 14-19 (2010). 2010年10月, 東京大学, 東京.
-''複利型強化学習''. 松井藤五郎. 2010年度人工知能学会全国大会 JSAI 2010, 1A3-2 (2010). 2010年6月, 長崎ブリック・ホール, 長崎. 人工知能学会論文誌速報論文特集推薦.
-''ファイナンスのための強化学習''. 松井藤五郎. 第3回ファイナンスにおける人工知能応用研究会 (SIG-FIN), pp. 81-88 (2009). 2009年9月, 産業技術総合研究所 臨海副都心センター, 東京.
トップ   編集 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS