Sample Complexity and Overparameterization Bounds for Temporal-Difference Learning With Neural Network Approximation
Cayci, Semih (Corresponding author); Satpathi, Siddhartha; He, Niao; Srikant, R.
New York, NY : Institute of Electrical and Electronics Engineers (2023)
Fachzeitschriftenartikel
In: IEEE Transactions on Automatic Control
Band: 68
Heft: 5
Seite(n)/Artikel-Nr.: 2891-2905
Einrichtungen
- Fachgruppe Mathematik [110000]
- Lehrstuhl für Mathematik der Informationsverarbeitung [114510]
- Juniorprofessur für Mathematik des Maschinellen Lernens [119730]
Identifikationsnummern
- DOI: 10.1109/TAC.2023.3234234
- RWTH PUBLICATIONS: RWTH-2023-08433