Loading...

A tutorial on linear function approximators for dynamic programming and reinforcement learning

Alborz Geramifard

  • Bindwijze: Paperback
  • Taal: en
  • Categorie: Computers & Informatica
  • ISBN: 9781601987600
Inhoud
Taal:en
Bindwijze:Paperback
Oorspronkelijke releasedatum:19 december 2013
Aantal pagina's:92
Illustraties:Nee
Betrokkenen
Hoofdauteur:Alborz Geramifard
Tweede Auteur:Thomas J. Walsh
Co Auteur:Nicholas Roy
Co Auteur:Nicholas Roy
Overige kenmerken
Extra groot lettertype:Nee
Product breedte:156 mm
Product hoogte:5 mm
Product lengte:234 mm
Studieboek:Ja
Verpakking breedte:156 mm
Verpakking hoogte:5 mm
Verpakking lengte:234 mm
Verpakkingsgewicht:143 g
Overige kenmerken
Extra groot lettertype:Nee
Product breedte:156 mm
Product hoogte:5 mm
Product lengte:234 mm
Studieboek:Ja
Verpakking breedte:156 mm
Verpakking hoogte:5 mm
Verpakking lengte:234 mm
Verpakkingsgewicht:143 g

Samenvatting

A Markov Decision Process (MDP) is a natural framework for formulating sequential decision-making problems under uncertainty. In recent years, researchers have greatly advanced algorithms for learning and acting in MDPs. This book reviews such algorithms.