Sie befinden Sich nicht im Netzwerk der Universität Paderborn. Der Zugriff auf elektronische Ressourcen ist gegebenenfalls nur via VPN oder Shibboleth (DFN-AAI) möglich. mehr Informationen...
Ergebnis 16 von 33
2015 IEEE 19th International Conference on Intelligent Engineering Systems (INES), 2015, p.119-123
2015
Volltextzugriff (PDF)

Details

Autor(en) / Beteiligte
Titel
The optimistic exploration value function
Ist Teil von
  • 2015 IEEE 19th International Conference on Intelligent Engineering Systems (INES), 2015, p.119-123
Ort / Verlag
IEEE
Erscheinungsjahr
2015
Quelle
IEEE Electronic Library Online
Beschreibungen/Notizen
  • The paper presents an approach that uses optimistic initialization and scalarized multi-objective learning to facilitate exploration in the context of model-free reinforcement learning. In contrast to existing optimistic intialization approaches, the approach introduces an extra value function, which is initialized optimistically and then updated using a zero reward function. Linear or Chebyshev scalarization is then used to compound this function with the standard task-related value function, thus forming an exploration policy. The paper concludes with evaluation of the approach on a benchmark task.
Sprache
Englisch
Identifikatoren
DOI: 10.1109/INES.2015.7329650
Titel-ID: cdi_ieee_primary_7329650
Format
Schlagworte
Chebyshev approximation

Weiterführende Literatur

Empfehlungen zum selben Thema automatisch vorgeschlagen von bX