Passt nicht? Macht nichts! Sie können Artikel bis zu 30 Tage zurückgeben
Mit einem Geschenkgutschein können Sie nichts falsch machen. Der Beschenkte kann sich im Tausch gegen einen Geschenkgutschein etwas aus unserem Sortiment aussuchen.
Bis zu 30 Tage Rückgaberecht
In this book, approximate dynamic programming (ADP) designs based on adaptive critic structures are developed to solve the discrete-time optimal control problems in which the state and action spaces are continuous. This work considers linear discrete-time systems as well as nonlinear discrete- time systems that are affine in the input. This work resulted in forward-in-time reinforcement learning algorithms that converge to the solution of the Generalized Algebraic Riccati Equation (GARE) for linear systems. For the nonlinear case, a forward-in-time reinforcement learning algorithm is presented that converges to the solution of the associated Hamilton-Jacobi Bellman equation (HJB).
Hallo! Ich bin Libroamiko, dein Buchberater.
Wie kann ich dir helfen?