ISSN:
1436-6304
Source:
Springer Online Journal Archives 1860-2000
Topics:
Mathematics
,
Economics
Description / Table of Contents:
Zusammenfassung Periodizität ist eine einfache Form der Nichtstationarität bei Markoffschen Entscheidungsprozessen. In dieser Arbeit werden sukzessive Approximationen für diskontierte und nichtdiskontierte periodische Markoffsche Entscheidungsprozesse betrachtet. Für solche Prozesse können Iterationsschritte ohne Verlust der Effizienz durchgeführt werden, wenn nur die Prozedur vernünftig gewählt wird. Darüber hinaus können — dies ist sehr wichtig — scharfe Grenzen für die Wertfunktion angegeben werden. Über numerische Erfahrungen wird berichtet.
Notes:
Summary Periodicity is a simple form of nonstationarity in Markov decision processes. In this paper successive approximations are considered for discounted and undiscounted periodic Markov decision processes. For this type of process iteration steps can be performed without any loss of efficiency, provided the type of procedure is sensibly chosen. Moreover, and most important, it is possible to derive sharp bounds for the value function. Numerical evidence is provided.
Type of Medium:
Electronic Resource
URL:
http://dx.doi.org/10.1007/BF01720020