強化学習/強化学習の参考文献の変更点

追加された行はこの色です。
削除された行はこの色です。
強化学習/強化学習の参考文献へ行く。
強化学習/強化学習の参考文献の差分を削除

*教科書 [#j2e5cd59]

-[[''強化学習'':http://www.amazon.co.jp/gp/product/4627826613?ie=UTF8&tag=tohgoroh-22&linkCode=as2&camp=247&creative=1211&creativeASIN=4627826613]].~
Sutton, R.S., Barto, A.G. (著), 三上 貞芳, 皆川 雅章 (訳). 森北出版 (2000). 
-[[''強化学習'':http://www.amazon.co.jp/gp/product/4627826613?ie=UTF8&tag=tohgoroh-22&linkCode=as2&camp=247&creative=1211&creativeASIN=4627826613]]~
Sutton, R.S., Barto, A.G. (著), 三上 貞芳, 皆川 雅章 (訳). 森北出版 (2000)
>&ref(RL_book.jpg,nolink);


-[[''マルチエージェント学習''&mdash;相互作用の謎に迫る&mdash;:http://www.amazon.co.jp/gp/product/4339023957?ie=UTF8&tag=tohgoroh-22&linkCode=as2&camp=247&creative=7399&creativeASIN=4339023957]].~
高玉 圭樹.  コロナ社 (2003).
-[[''マルチエージェント学習''&mdash;相互作用の謎に迫る&mdash;:http://www.amazon.co.jp/gp/product/4339023957?ie=UTF8&tag=tohgoroh-22&linkCode=as2&camp=247&creative=7399&creativeASIN=4339023957]]~
高玉 圭樹, コロナ社 (2003)
>&ref(MAL_book.jpg,nolink);
>3章に強化学習が解説されています．
Profit sharingのアルゴリズムも載っています．


*チュートリアル論文，サーベイ論文 [#e4d197ec]
-[[''Reinforcement Learning: A Tutorial Survey and Recent Advances'':http://joc.journal.informs.org/cgi/content/abstract/ijoc.1080.0305v1]]~
Abhijit Gosavi, INFORMS Journal on Computing, Vol. 21, No. 2, pp. 178-192 (2009)
>4章に最近の話題が載っています．
著者のサイトでドラフトのPDFが配布されています．


*Web [#g15221a3]

-[[''Sutton &amp; Barto Book: Reinforcement Learning: An Introduction'':http://www.cs.ualberta.ca/~sutton/book/the-book.html]]
>上の「強化学習」の英語版が全て読めます．
>教科書『強化学習』の英語版が全て読めます．

-[[''RL FAQ'':http://www.cs.ualberta.ca/~sutton/RL-FAQ.html]]
>SuttonさんによるFAQです．