Sie befinden Sich nicht im Netzwerk der Universität Paderborn. Der Zugriff auf elektronische Ressourcen ist gegebenenfalls nur via VPN oder Shibboleth (DFN-AAI) möglich. mehr Informationen...
Adaptive Dynamical Programming control with combination of off-line and on-line training
Ist Teil von
Proceedings of the 31st Chinese Control Conference, 2012, p.733-736
Ort / Verlag
IEEE
Erscheinungsjahr
2012
Quelle
IEEE Xplore
Beschreibungen/Notizen
This paper studies off-line control and on-line control based on Adaptive Dynamical Programming and proposes an optimal adaptive algorithm with the combination of off-line and on-line training; The method using off-line value iteration algorithm gets off-line opitical controller, then using on-line policy iteration algorithm of Q learning improves the off-line opitical controller. Simulation results show that the proposed approach is effective.