ISSN:
1436-6304
Source:
Springer Online Journal Archives 1860-2000
Topics:
Mathematics
,
Economics
Description / Table of Contents:
Zusammenfassung Wir betrachten die Wertiteration bei diskontierten Markovschen Entscheidungsprozessen mit abzählbarem Zustandsraum. Wir zeigen, daß unter gewissen Bedingungen eineN-isotone Folge von optimalen Entscheidungsregeln und Wertfunktionen existiert.N-isoton heißt eine Folge von Entscheidungsregeln {δ n },n ∈ {1,2,...}=N, dann, wenn für eine Halbordnung ≲ überK=UK(i) gilt δ n−1 (i) δ n−1(i)≲δ n (i) für allen⩾2 undi ∈I. (K(i is die Menge der zulässigen Aktionen im Zustandi). Eine analoge Definition derN-Isotonie gilt für die Wertfunktionen {vn},n⩾1.
Notes:
Summary This paper considers the value iteration process for countable state discounted Markov decision processes and shows that under certain conditions there will exist anN-isotone sequence of optimal decision rules and value functions, whereN-isotonicity of a sequence of decision rules {δ n }, n ∈ {1,2,...}=N requires that, for a specified partial order ≲ overK=UK(i) (K(i) being the feasible action space fori) then δ n−1(i)≲δ n (i), ∀n⩾2 and alli ∈I, with a similar definition ofN-isotonic for the value functions {v n },n⩾1.
Type of Medium:
Electronic Resource
URL:
http://dx.doi.org/10.1007/BF01720072
Permalink