A tutorial on linear function approximators for dynamic programming and reinforcement learning

Alborz Geramifard

Bindwijze: Paperback
Taal: en
Categorie: Computers & Informatica
ISBN: 9781601987600

Inhoud

Taal:	en
Bindwijze:	Paperback
Oorspronkelijke releasedatum:	19 december 2013
Aantal pagina's:	92
Illustraties:	Nee

Betrokkenen

Hoofdauteur:	Alborz Geramifard
Tweede Auteur:	Thomas J. Walsh
Co Auteur:	Nicholas Roy
Co Auteur:	Nicholas Roy

Overige kenmerken

Extra groot lettertype:	Nee
Product breedte:	156 mm
Product hoogte:	5 mm
Product lengte:	234 mm
Studieboek:	Ja
Verpakking breedte:	156 mm
Verpakking hoogte:	5 mm
Verpakking lengte:	234 mm
Verpakkingsgewicht:	143 g

Overige kenmerken

Extra groot lettertype:	Nee
Product breedte:	156 mm
Product hoogte:	5 mm
Product lengte:	234 mm
Studieboek:	Ja
Verpakking breedte:	156 mm
Verpakking hoogte:	5 mm
Verpakking lengte:	234 mm
Verpakkingsgewicht:	143 g

Samenvatting

A Markov Decision Process (MDP) is a natural framework for formulating sequential decision-making problems under uncertainty. In recent years, researchers have greatly advanced algorithms for learning and acting in MDPs. This book reviews such algorithms.

Bestseller Boeken

Bestseller Boeken

Bestseller Boeken

A tutorial on linear function approximators for dynamic programming and reinforcement learning

Alborz Geramifard

Samenvatting

Reviews