ISSN:
1436-6304
Keywords:
Key words: Markov decision processes
;
variance penalty
;
mean-variance tradeoff
;
convex polytopes
;
Schlüsselwörter: Markoffsche Entscheidungsprozesse
;
Varianz-Strafterm
;
konvexe Polytope
Source:
Springer Online Journal Archives 1860-2000
Topics:
Mathematics
,
Economics
Description / Table of Contents:
Zusammenfassung. Es wird ein Markoffscher Entscheidungsprozeß mit endlichem Horizont betrachtet; Auszahlungen erfolgen nur am Ende des Prozesses. Dazu wird ein endlicher Algorithmus zur Bestimmung einer deterministischen Markoff-Politik beschrieben, der die um einen Varianz-Strafterm verminderte Auszahlung maximiert. Darüber hinaus wird eine Ecken-Eliminationsprozedur dargestellt, die zu einer Reduktion des Rechenaufwands führen kann.
Notes:
Abstract. We consider a finite horizon Markov decision process with only terminal rewards. We describe a finite algorithm for computing a Markov deterministic policy which maximises the variance penalised reward and we outline a vertex elimination algorithm which can reduce the computation involved.
Type of Medium:
Electronic Resource
URL:
http://dx.doi.org/10.1007/BF01539805
Permalink