機械学習研究ジャーナル JMLR

2011-06-06 (月) 20:53:25 (4701d) | Topic path: Top / 強化学習 / 機械学習研究ジャーナル JMLR

Journal of Machine Learning Researchに掲載された強化学習に関する論文.
(順次追加しており,完全なリストではありません.)

逆強化学習

POMDP

転移学習

環境変化・動的環境

マルチエージェント

階層型強化学習

  • Hierarchical Average Reward Reinforcement Learning
    Mohammad Ghavamzadeh, Sridhar Mahadevan
    JMLR 8:2629-2669 (2007).
    Keywords: semi-Markov decision processes, hierarchical reinforcement learning, average reward reinforcement learning, hierarchical and recursive optimality

バッチ学習

  • Tree-Based Batch Mode Reinforcement Learning
    Damien Ernst, Pierre Geurts, Louis Wehenkel
    JMLR 6:503-556 (2005).
    Keywords: batch mode reinforcement learning, regression trees, ensemble methods, supervised learning, fitted value iteration, optimal control

多目的強化学習

探査と知識利用のジレンマ

学習分析

TD学習

アクター・クリティック

モデル・ベースド

探査

  • Policy Gradient in Continuous Time
    Rémi Munos
    JMLR 7:771-791 (2006).
    Keywords: optimal control, reinforcement learning, policy search, sensitivity analysis, para- metric optimization, gradient estimate, likelihood ratio method, pathwise derivation
  • Policy Search using Paired Comparisons
    Malcolm J. A. Strens, Andrew W. Moore
    JMLR 3:921-950 (2002).
    Keywords: Reinforcement Learning, Policy Search, Experiment Design

ツール

トップ   編集 凍結解除 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS