Arrêt optimal
En mathématiques, la théorie de l'arrêt optimal[1],[2] ou de l'arrêt anticipé[3] concerne le problème du choix d'un moment pour entreprendre une action spécifique, afin de maximiser une récompense attendue ou de minimiser un coût attendu. Des problèmes d'arrêt optimaux peuvent être trouvés dans les domaines des statistiques, de l'économie et des mathématiques financières (liés à la tarification des options américaines). Un exemple clé de problème d'arrêt optimal est le problème du secrétaire. Les problèmes d'arrêt optimal peuvent souvent être écrits sous forme d'une équation de Bellman et souvent résolus à l'aide d'une programmation dynamique.
En temps discret
[modifier | modifier le code]Les problèmes de règle d'arrêt sont liés à deux entités :
- Une séquence de variables aléatoires , dont la distribution jointe est supposé connu
- Une séquence de fonctions de « récompense » qui dépendent des valeurs observées des variables aléatoires en 1 :
En considérant ces éléments, le problème se pose de la manière suivante :
- Vous observez la séquence de variables aléatoires, et à chaque étape , vous pouvez choisir d'arrêter l'observation ou de continuer
- Si vous arrêtez d'observer à l'étape , vous recevrez une récompense
- Vous souhaitez choisir une règle d'arrêt pour maximiser votre récompense attendue (ou de manière équivalente, minimiser votre perte attendue)
En temps continu
[modifier | modifier le code]Soit un processus de gain défini sur un espace de probabilité filtré et supposons que est adapté à la filtration. Le problème d'arrêt optimal est de trouver le temps d'arrêt qui maximise le gain attendu
où est appelée la fonction valeur . Ici peut prendre de la valeur .
Nous considérons un processus de Markov adapté défini sur un espace de probabilité filtré où désigne la mesure de probabilité à laquelle le processus stochastique commence à . Étant donné les fonctions continues , et , le problème d'arrêt optimal est
Parfois, on fait référence à la formulation MLS, abréviation représentant les noms de Mayer, Lagrange et Supremum[4].
Méthodes de résolution
[modifier | modifier le code]Il existe deux approches pour résoudre les problèmes d’arrêt optimal[4]. Lorsque le processus sous-jacent (ou le processus de gain) est décrit par ses distributions inconditionnelles de dimension finie, la technique de solution appropriée est l'approche martingale, ainsi appelée parce qu'elle utilise la théorie de la martingale, le concept le plus important étant l'enveloppe de Snell. Pour des plages de temps discrètes et un horizon de planification fini, la résolution du problème peut être aisément effectuée en utilisant la programmation dynamique.
Lorsque le processus sous-jacent est déterminé par une famille de fonctions de transition (conditionnelles) conduisant à une famille de probabilités de transition de Markov, de puissants outils analytiques fournis par la théorie des processus de Markov peuvent souvent être utilisés et cette approche est appelée méthode de Markov. La solution est généralement obtenue en résolvant les problèmes de frontière libre (problèmes de Stefan).
Un résultat de diffusion par saut
[modifier | modifier le code]Soit , une diffusion Lévy en donné par le SDE
où est un -dimensionnel mouvement brownien, est un -dimensionnel mesure aléatoire de Poisson compensée, , , et reçoivent des fonctions telles qu'une solution unique existe. Soit , un ensemble ouvert (la région de solvabilité) et
, le moment de la faillite. Le problème d’arrêt optimal est :
Il s’avère que sous certaines conditions de régularité[5], le théorème de vérification suivant est valable :
Si une fonction satisfait
- où se trouve la région de continuation ,
- sur , et
- sur , où est le générateur infinitésimal de
alors pour tout . De plus, si
- sur
Alors pour tout et est un temps d'arrêt optimal.
Exemples
[modifier | modifier le code]Lancer de pièces
[modifier | modifier le code](Exemple où converge)
Vous avez une pièce de monnaie et vous la lancez à plusieurs reprises. À chaque fois, avant qu'il ne soit lancé, vous pouvez choisir d'arrêter de le lancer et d'être payé (en dollars, par exemple) le nombre moyen de piles observés.
et si
alors les séquences , et sont les objets associés à ce problème.
(Exemple où ne converge pas nécessairement)
Vous possédez une maison et souhaitez la vendre. Chaque jour on vous propose pour votre maison et vous payez pour continuer à en faire la publicité. Si vous vendez votre maison le jour , vous gagnerez , où .
Vous souhaitez maximiser le montant que vous gagnez en choisissant une règle d'arrêt.
Dans cet exemple, la séquence ( ) est la séquence d'offres pour votre maison, et la séquence de fonctions de récompense correspond au montant que vous gagnerez.
Problème de secrétaire
[modifier | modifier le code](Exemple où est une suite finie)
Vous cherchez à adopter une séquence d’objets qui peuvent être classés du meilleur au pire. Vous souhaitez choisir une règle d'arrêt qui maximise vos chances de sélectionner le meilleur objet.
Ici, si ( n est un grand nombre) sont les rangs des objets, et est la chance que vous choisissiez le meilleur objet si vous arrêtez de rejeter intentionnellement des objets à l'étape i, alors et sont les séquences associées à ce problème. Ce problème a été résolu dans les années 1960 par plusieurs personnes. Une solution au problème du secrétaire et plusieurs modifications de ce problème sont fournies par l'algorithme de cotes d'arrêt optimal le plus récent (algorithme de Bruss).
Théorie de la recherche
[modifier | modifier le code]Les économistes ont étudié un certain nombre de problèmes d'arrêt optimal similaires au « problème du secrétaire » et appellent généralement ce type d'analyse « théorie de la recherche ». La théorie de la recherche s'est spécifiquement penchée sur la quête d'un employé pour un poste à haute rémunération ou la recherche d'un consommateur pour un produit à prix réduit.
Problème de stationnement
[modifier | modifier le code]Un exemple particulier d'application de la théorie de la recherche est la sélection optimale d'une place de stationnement par un conducteur se rendant à l'opéra (théâtre, shopping, etc.). En arrivant à destination, le conducteur emprunte la rue le long de laquelle se trouvent des places de stationnement – généralement, seules certaines places du parking sont gratuites. L'objectif est clairement visible, ce qui permet d'évaluer facilement la distance par rapport à la cible. La tâche du conducteur est de sélectionner un emplacement de stationnement gratuit le plus proche possible de la destination sans faire demi-tour afin que la distance de cet endroit à la destination soit la plus courte[6].
Négociation d'options
[modifier | modifier le code]Lors de la négociation d'options sur les marchés financiers, le détenteur d'une option américaine est autorisé à exercer le droit d'acheter (ou de vendre) l'actif sous-jacent à un prix prédéterminé à tout moment avant ou à la date d'expiration. La valorisation des options américaines constitue donc essentiellement un problème d’arrêt optimal. Considérons une configuration classique de Black-Scholes et soit ,,le taux d’intérêt sans risque ; , le taux de dividende et , la volatilité du titre. Le cours de l'action suit le mouvement brownien géométrique suivant :
dans le cadre de la mesure de risque neutre.
Lorsque l’option est perpétuelle, le problème d’arrêt optimal est :
où la fonction de paiement est pour une option d'achat et pour une option de vente. L'inégalité variationnelle est la suivante :
pour tout où est la limite de l’exercice. La solution est connue pour être [7]
- (Option d'achat perpétuel) où et
- (Option de vente perpétuelle) où et
D’un autre côté, lorsque la date d’expiration est finie, le problème est associé à un problème bidimensionnel à frontière libre sans solution de forme fermée connue. Diverses méthodes numériques peuvent cependant être utilisées, comme le modèle Black-Scholes pour diverses méthodes d'évaluation ici, ainsi que Fugit pour un calcul discret, basé sur un arbre, du moment optimal pour exercer.
Notes et références
[modifier | modifier le code]- Y.S. Chow, H. Robbins et D. Siegmund, Great Expectations: The Theory of Optimal Stopping, Boston, Houghton Mifflin,
- Thomas S. Ferguson, Optimal Stopping and Applications, UCLA, (lire en ligne)
- Hill, « Knowing When to Stop », American Scientist, vol. 97, no 2, , p. 126–133 (ISSN 1545-2786, DOI 10.1511/2009.77.126, S2CID 124798270)
- Goran Peskir et Albert Shiryaev, Optimal Stopping and Free-Boundary Problems, coll. « Lectures in Mathematics. ETH Zürich », (ISBN 978-3-7643-2419-3, DOI 10.1007/978-3-7643-7390-0)
- B. Øksendal et A. Sulem, Applied Stochastic Control of Jump Diffusions, (ISBN 978-3-540-69825-8, DOI 10.1007/978-3-540-69826-5, S2CID 123531718)
- MacQueen et Miller Jr., « Optimal persistence policies », Operations Research, vol. 8, no 3, , p. 362–380 (ISSN 0030-364X, DOI 10.1287/opre.8.3.362)
- Ioannis Karatzas et Steven E. Shreve, Methods of Mathematical Finance, vol. 39, coll. « Stochastic Modelling and Applied Probability », (ISBN 978-0-387-94839-3, DOI 10.1007/b98840)