Reference : Computing bounds for kernel-based policy evaluation in reinforcement learning
Reports : External report
Engineering, computing & technology : Computer science
http://hdl.handle.net/2268/103545
Computing bounds for kernel-based policy evaluation in reinforcement learning
English
Fonteneau, Raphaël mailto [Université de Liège - ULg > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Systèmes et modélisation >]
Murphy, Susan A. [ > > ]
Wehenkel, Louis mailto [Université de Liège - ULg > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Systèmes et modélisation >]
Ernst, Damien mailto [Université de Liège - ULg > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Smart grids >]
2010
University of Liège
[en] Batch mode reinforcement learning
[en] This technical report proposes an approach for computing bounds on the finite-time return of a policy using kernel-based approximators from a sample of trajectories in a continuous state space and deterministic framework.
Fonds de la Recherche Scientifique (Communauté française de Belgique) - F.R.S.-FNRS
http://hdl.handle.net/2268/103545

File(s) associated to this reference

Fulltext file(s):

FileCommentaryVersionSizeAccess
Open access
technical_report.pdfAuthor postprint237.47 kBView/Open

Bookmark and Share SFX Query

All documents in ORBi are protected by a user license.