Paper published in a book (Scientific congresses and symposiums)
Apprentissage par renforcement batch fondé sur la reconstruction de trajectoires artificielles
Fonteneau, Raphaël; Murphy, Susan A.; Wehenkel, Louis et al.
2014In Proceedings of the 9èmes Journées Francophones de Planification, Décision et Apprentissage (JFPDA 2014)
Peer reviewed
 

Files


Full Text
Fonteneau2014JFPDA_ArtTraj.pdf
Author preprint (575.11 kB)
Download

All documents in ORBi are protected by a user license.

Send to



Details



Keywords :
Apprentisssage par renforcement
Abstract :
[fr] Cet article se situe dans le cadre de l’apprentissage par renforcement en mode batch, dont le problème central est d’apprendre, à partir d’un ensemble de trajectoires, une politique de décision optimisant un critère donné. On considère plus spécifiquement les problèmes pour lesquels l’espace d’état est continu, problèmes pour lesquels les schémas de résolution classiques se fondent sur l’utilisation d’approxima- teurs de fonctions. Cet article propose une alternative fondée sur la reconstruction de “trajectoires arti- ficielles” permettant d’aborder sous un angle nouveau les problèmes classiques de l’apprentissage par renforcement batch.
Disciplines :
Computer science
Author, co-author :
Fonteneau, Raphaël ;  Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Systèmes et modélisation
Murphy, Susan A.
Wehenkel, Louis  ;  Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Systèmes et modélisation
Ernst, Damien  ;  Université de Liège - ULiège > Dép. d'électric., électron. et informat. (Inst.Montefiore) > Smart grids
Language :
French
Title :
Apprentissage par renforcement batch fondé sur la reconstruction de trajectoires artificielles
Publication date :
2014
Event name :
9èmes Journées Francophones de Planification, Décision et Apprentissage (JFPDA 2014)
Event date :
12-13 mai 2014
Audience :
International
Main work title :
Proceedings of the 9èmes Journées Francophones de Planification, Décision et Apprentissage (JFPDA 2014)
Peer reviewed :
Peer reviewed
Available on ORBi :
since 30 April 2014

Statistics


Number of views
115 (6 by ULiège)
Number of downloads
231 (4 by ULiège)

Bibliography


Similar publications



Contact ORBi