*教科書 [#j2e5cd59]
-[[''強化学習'':http://www.amazon.co.jp/gp/product/4627826613?ie=UTF8&tag=tohgoroh-22&linkCode=as2&camp=247&creative=1211&creativeASIN=4627826613]].~
Sutton, R.S., Barto, A.G. (著), 三上 貞芳, 皆川 雅章 (訳). 森北出版 (2000).
-[[''強化学習'':http://www.amazon.co.jp/gp/product/4627826613?ie=UTF8&tag=tohgoroh-22&linkCode=as2&camp=247&creative=1211&creativeASIN=4627826613]]~
Sutton, R.S., Barto, A.G. (著), 三上 貞芳, 皆川 雅章 (訳). 森北出版 (2000)
>&ref(RL_book.jpg,nolink);
-[[''マルチエージェント学習''—相互作用の謎に迫る—:http://www.amazon.co.jp/gp/product/4339023957?ie=UTF8&tag=tohgoroh-22&linkCode=as2&camp=247&creative=7399&creativeASIN=4339023957]].~
高玉 圭樹. コロナ社 (2003).
-[[''マルチエージェント学習''—相互作用の謎に迫る—:http://www.amazon.co.jp/gp/product/4339023957?ie=UTF8&tag=tohgoroh-22&linkCode=as2&camp=247&creative=7399&creativeASIN=4339023957]]~
高玉 圭樹, コロナ社 (2003)
>&ref(MAL_book.jpg,nolink);
>3章に強化学習が解説されています.
Profit sharingのアルゴリズムも載っています.
*チュートリアル論文,サーベイ論文 [#e4d197ec]
-[[''Reinforcement Learning: A Tutorial Survey and Recent Advances'':http://joc.journal.informs.org/cgi/content/abstract/ijoc.1080.0305v1]]~
Abhijit Gosavi, INFORMS Journal on Computing, Vol. 21, No. 2, pp. 178-192 (2009)
>4章に最近の話題が載っています.
著者のサイトでドラフトのPDFが配布されています.
*Web [#g15221a3]
-[[''Sutton & Barto Book: Reinforcement Learning: An Introduction'':http://www.cs.ualberta.ca/~sutton/book/the-book.html]]
>上の「強化学習」の英語版が全て読めます.
>教科書『強化学習』の英語版が全て読めます.
-[[''RL FAQ'':http://www.cs.ualberta.ca/~sutton/RL-FAQ.html]]
>SuttonさんによるFAQです.