Sample Complexity and Overparameterization Bounds for Temporal-Difference Learning With Neural Network Approximation

Cayci, Semih (Corresponding author); Satpathi, Siddhartha; He, Niao; Srikant, R.

New York, NY : Institute of Electrical and Electronics Engineers (2023)
Fachzeitschriftenartikel

In: IEEE Transactions on Automatic Control
Band: 68
Heft: 5
Seite(n)/Artikel-Nr.: 2891-2905

Einrichtungen

  • Fachgruppe Mathematik [110000]
  • Lehrstuhl für Mathematik der Informationsverarbeitung [114510]
  • Juniorprofessur für Mathematik des Maschinellen Lernens [119730]

Identifikationsnummern