Summary
This paper considers infinite horizon discounted Markov decision processes and conditions under which discount-isotone optimal policies exist. Given partial orders over the state and action spaces, a set of discount-isotone optimal policies is a set of optimal policies, one for each discount factor in a given set, such that, for each state, the optimal actions are partially ordered in such a manner as to match the ordering of the discount factors. It is easier to solve problems with small discount factors and the induced partial ordering facilitates the solutions for higher discount factor levels.
Zusammenfassung
Für unendlich-stufige diskontierte Markovsche Entscheidungsprozesse werden Bedingungen angegeben, unter denen sogenannte “diskont-isotone” optimale Politiken existieren. Eine diskont-isotone Familie von optimalen Politiken liegt vor, wenn die Zustands- und Aktionenräume halbgeordnet sind und für eine Menge von Diskontierungsfaktoren je eine optimale Politik existiert, so daß in jedem Zustand die optimalen Aktionen isoton vom Diskontierungsfaktor abhängen. Es kann günstiger sein, zunächst Probleme mit kleinem Diskontierungsfaktor zu lösen und dann die Isotonie-Eigenschaften zur Lösung für größere Diskontierungsfaktoren heranzuziehen.
Similar content being viewed by others
References
Bellman R (1957) Dynamic programming. Princeton University Press, New Jersey
Blackwell D (1965) Discounted dynamic programming. Ann Math Stat 36:226–235
Rockafellar R (1972) Convex analysis. Princeton University Press, New Jersey
Serfozo RF (1976) Monotone optimal policies for Markov decision processes. Math Prog Study 6:202–215
White DJ (1978) Finite dynamic programming. Wiley, New York
White DJ (1984) Isotone policies for the value iteration method for Markov decision processes. OR Spektrum 6:223–227
White DJ (1982) Negatively isotone optimal policies for random walk type Markov decision processes. OR Spektrum 4:41–45
Author information
Authors and Affiliations
Rights and permissions
About this article
Cite this article
White, D.J. Discount-isotone policies for Markov decision processes. OR Spektrum 10, 13–22 (1988). https://doi.org/10.1007/BF01720029
Received:
Accepted:
Issue Date:
DOI: https://doi.org/10.1007/BF01720029