Combinatoire analytique
En mathématiques, et plus précisément en combinatoire, la combinatoire analytique (en anglais : analytic combinatorics) est un ensemble de techniques décrivant des problèmes combinatoires dans le langage des séries génératrices, et s'appuyant en particulier sur l'analyse complexe pour obtenir des résultats asymptotiques sur les objets combinatoires initiaux.
Les résultats de combinatoire analytique permettent notamment une analyse fine de la complexité de certains algorithmes.
Introduction
[modifier | modifier le code]La combinatoire analytique repose fondamentalement sur deux approches : la première approche, combinatoire, également parfois qualifiée de méthode symbolique, permet de décrire des relations entre des objets mathématiques discrets en les transcrivant directement en termes d'opérations algébriques sur les séries génératrices associées; la deuxième approche, analytique, utilise ou développe des outils d'analyse complexe en vue d'extraire de ces séries génératrices des informations sur le comportement asymptotique du nombre d'objets énumérés. C'est ainsi la nature des singularités de ces séries qui est la clé de l'étude du comportement asymptotique des objets discrets initiaux. Une application importante est l'étude de propriétés probabilistes de grandes structures aléatoires.
Cette théorie a été largement développée notamment par Philippe Flajolet et son école. Elle est détaillée dans son livre avec Robert Sedgewick, Analytic Combinatorics[1]. Elle trouve sa source dans des travaux de précurseurs comme Leonhard Euler, Arthur Cayley, Srinivasa Ramanujan, Gaston Darboux, George Pólya et Donald Knuth.
Classes combinatoire
[modifier | modifier le code]La méthode symbolique s'appuie sur le concept de classe combinatoire, c'est-à-dire d'ensembles d'objets, où chaque objet a une taille. La méthode permet de traduire des opérations ensemblistes sur les classes en des opérations algébriques sur les séries génératrices associées. On obtient ainsi un processus de traduction purement formel, et automatisable. En pratique, on utilise souvent des séries génératrices dites ordinaires pour les structures non étiquetées, et des séries génératrices exponentielles pour les structures étiquetées. D'autres types de séries génératrices (de Dirichlet, de Poisson, de Bell, de Lambert, de Wright, ...) sont toutefois aussi utilisables.
Définitions
[modifier | modifier le code]Une classe combinatoire est par définition un ensemble muni d'une application appelée taille qui, à chaque élément de l'ensemble associe un entier naturel . On demande de plus que, pour chaque , le nombre d'éléments de taille est fini.
Comme la définition le suggère, un même ensemble peut être doté de plusieurs tailles différentes. Ainsi, la taille des arbres binaires peut être leur nombre de sommet; une autre taille est leur hauteur. Mais le nombre de feuilles n'est pas une taille valide, parce qu'il existe une infinité d'arbres binaires « filiformes » (où chaque nœud n'a qu'il seul enfant) qui n'ont qu'une feuille unique. En général, un objet d'une certaine taille est formé de composants élémentaires que l’on appelle parfois des atomes (comme les sommets d'un graphe par exemple).
Soit maintenant un ensemble combinatoire, et soit le nombre d'éléments de taille de . La série génératrice ordinaire associée à est par définition la série définie par
- .
Il est parfois commode de considérer une autre expression équivalente pour la série, à savoir :
- .
On considère aussi, dans le cas de structures étiquetées, des séries génératrices exponentielles dont il sera question plus bas.
En général, les séries génératrices associées au dénombrement d'objets combinatoires sont des séries formelles, que l'on peut manipuler sans considération de convergence (au sens de convergence dans les réels ou dans les complexes), mais il existe en fait une notion de convergence dans l'anneau des séries formels qui repose sur la valuation des séries et qui donne un cadre rigoureux à toutes les manipulations mentionnées ci-après. Dans le cadre de la combinatoire analytique, les questions de convergence jouent d'ailleurs un rôle, puisqu'on étudie le comportement des séries en des points précis, dans le cadre de l’analyse complexe. L'observation fondamentale utilisée - qui est explicitée plus loin - est que la nature de la singularité sur l'axe réel positif donne des informations précises sur la croissance des nombres d'objets de taille .
Une notation utile pour l'extraction de coefficients d'une série génératrice est la suivante : on désigne par le coefficient de la variable , de sorte que, pour
- ,
on a :
- .
Dans la suite de cet article, on parle parfois, avec un léger abus de langage, des coefficients d'une fonction, pour désigner les coefficients du développement de Taylor en 0 de cette fonction.
Exemples
[modifier | modifier le code]Quelques exemples usuels sont les suivants.
- Classe des mots sur un alphabet binaire, la taille est la longueur du mot. Il y a mots de longueur . La série génératrice est .
- Compositions d'entiers (une composition d'un entier positif est une suite d'entiers positifs tels que ). Chaque entier positif possède compositions. La série génératrice est .
- Arbres binaires complets. Le nombre d'arbres binaires complets à nœuds internes est , et la série génératrice est .
La méthode symbolique
[modifier | modifier le code]La méthode symbolique est un procédé qui permet de traduire directement des relations entre classes combinatoires dans les séries génératrices correspondantes. L'algorithme consiste à commencer avec des classes combinatoires très simples, et à les composer à l'aide d'opérateurs au comportement connu. Ces opérateurs ensemblistes comprennent diverses opérations simples, comme la réunion disjointe, le produit cartésien; d'autres opérations, comme l'ensemble des parties, la formation de suites, de multiensembles sont un peu plus complexes. Enfin des définitions récursives sont possibles. L'attrait de la méthode est que la définition ensembliste, ou symbolique, se traduit directement en de relations algébriques sur les fonctions génératrices.
Deux types de séries génératrices sont utilisées usuellement en combinatoire, les séries génératrices ordinaires, pour des classes combinatoires d'objets non étiquetés, et des séries génératrices exponentielles, pour des classes combinatoires d'objets étiquetés,
Il est d'usage, dans cette théorie, de noter les classes combinatoires par des lettres cursives, et leurs séries génératrices par les mêmes lettres, droites. Ainsi, les séries associées à des classes combinatoires ou sont notées respectivement et .
Constructions élémentaires
[modifier | modifier le code]Les briques de base sont des classes formées d'un seul objet. Deux types de classes sont utiles : celles où le singleton est de taille nulle, et celles dont le singleton est de taille un. Une classe du premier type a donc un élément de taille nulle, et sa série génératrice est la fonction constante . Une classe du deuxième type a un seul élément, de taille un, et sa série génératrice est ainsi . Les opérations élémentaires sont l'union disjointe, le produit cartésien, la formation de suites.
Union disjointe
[modifier | modifier le code]On écrit si la classe est l’union disjointe des classes et . Cette relation se traduit en séries génératrices par
puisqu'en effet
- .
Produit cartésien
[modifier | modifier le code]On écrit si la classe est l'ensemble des couples , avec et . La fonction taille est définie par . On a alors, pour les séries génératrices, la relation
- .
Séquences
[modifier | modifier le code]On écrit lorsque est l'ensemble des suites finies d'éléments de . Cette construction est aussi appelée étoile de Kleene en théorie des langages. On peut l'écrire plus formellement comme
- , ou encore .
La taille d'une suite est la somme des tailles de ses composants. Pour que l’opération soit bien définie, la classe ne doit pas contenir d'élément de taille 0 car sinon la classe contiendrait une infinité d'éléments d'une taille donnée. La traduction en séries génératrices est
- .
La série est appelée parfois le quasi-inverse de la série .
Définition récursive
[modifier | modifier le code]Lorsque certaines conditions assez techniques sont remplies[2], on peut définir une classe combinatoire de façon récursive. Voici des exemples.
Arbres binaires
[modifier | modifier le code]Le premier exemple est celui des arbres binaires. Un arbre binaire est soit l’arbre binaire vide, soit formé d'une racine et de deux sous-arbres qui sont des arbres binaires. L'équation de la classe combinatoire des arbres binaires est donc :
- ,
où est réduite à un élément de taille 0 et est composé d'un élément de taille 1. Cette équation se traduit en l’équation
- .
Arbres unaires-binaires
[modifier | modifier le code]Un arbre unaire-binaire est un arbre où chaque nœud interne a un ou deux enfants. L'équation symbolique s'écrit
d'où l'on déduit l'équation fonctionnelle
- .
Exemples
[modifier | modifier le code]On peut employer la méthode symbolique même dans des cas très élémentaires :
Mots binaires
[modifier | modifier le code]Un mot binaire est une suite de symboles 0 et 1. On a deux classes combinatoires et dont la série génératrice est . Les mots binaires sont donnés par la construction
- ,
leur série génératrice est
- et .
C'est utiliser une grosse artillerie pour un exemple tout simple.
Composition restreinte d'entiers
[modifier | modifier le code]Le problème est de couvrir le segment avec des briques de taille 1 et 2, en d'autre termes d'écrire l'entier comme une somme dont les termes sont 1 ou 2, et de compter le nombre de façons de le faire. Par exemple, l'entier 4 possède les cinq écritures :
- 4=1 1 1 1=1 1 2=1 2 1=2 1 1=2 2 .
Il est facile de voir directement que le nombre de ces compositions de est , le e nombre de Fibonacci. Pour utiliser la méthode symbolique, on considère deux classes et composées d'un élément unique de taille 1 et de taille 2 respectivement. Alors la classe de couvertures est
et la série génératrice est :
- .
Autres constructions symboliques
[modifier | modifier le code]D'autre constructions symboliques importantes sont : Cycles. Les cycles sont comme des séquences, sauf que deux objets qui s'obtiennent l'un de l'autre par une rotation circulaire ne sont pas considérés comme distincts. La série génératrice est nettement plus compliquée; dans le cas étiqueté, elle est plus simple. Ici, elle s'écrit
où est l'indicatrice d'Euler. Classe pointée. La classe est formée d'objets de qui sont « pointés » : dans chaque objet, un atome est distingué. Par exemple, les arbres enracinés sont des arbres libres pointés. Formellement, chaque objet est augmenté d'un élément de taille zéro sur un de ses atomes. La série génératrice est
- .
Substitution. La classe est obtenue en substituant, à chaque atome d'un élément de , un élément de la classe . La série génératrice est simplement .
Analyse
[modifier | modifier le code]Les méthodes d'analyse complexe se concentrent autour du processus d'extraction d'informations asymptotiques à partir de fonctions génératrices. Il existe un ensemble de résultats qui fournissent une traduction systématique entre fonctions génératrices et la forme asymptotique des coefficients.
Dans la plupart des situations qui se présentent en combinatoire, une série formelle
de dénombrement peut être vue comme le développement, autour de 0, d'une fonction analytique . Le rayon de convergence de la série est donné par exemple par
- .
Ceci signifie que
- )
où est une fonction sous-exponentielle de . Il y a donc au moins une singularité sur le bord du disque de convergence, et un théorème classique de Pringsheim dit que si les coefficients sont positifs, ce qui est bien le cas dans des séries énumératrices, alors il existe une singularité réelle positive au point .
Cas des séries rationnelles
[modifier | modifier le code]Pour les séries rationnelles, une décomposition en éléments simples donne une forme close pour le terme , qui s'écrit donc comme une somme de termes de la forme . Ainsi, si la singularité dominante R est de multiplicité , alors
- .
Exemple. On considère la série rationnelle
- .
Ses singularités sont (où désigne le nombre d'or). La singularité dominante est 1/2, et sa multiplicité est 5. On a donc
- .
Cas des séries algébrico-logarithmiques
[modifier | modifier le code]Considérons maintenant la classe des fonctions algébrico-logarithmiques, c'est-à-dire les sommes et produits de et de . Pour des séries génératrices ayant une telle forme, des méthodes d'analyse complexe[3] donnent l'asymptotique suivante pour leurs coefficients, exprimée ici dans le cas où la singularité est 1 (on peut toujours s'y ramener par un changement de variable):
- Soient et . On a
- ,
- où est la fonction Gamma usuelle.
Cet équivalent asymptotique peut en fait être poussé à n'importe quel ordre, ce qui donne par exemple[4] :
Fonction Coefficients
Remarquons que la classe des fonctions algébrico-logarithmiques n'englobe pas toutes les fonctions algébriques, mais toute fonction algébrique possède un développement en série de Puiseux qui est une somme infinie de briques de base du type , et la troncation de cette somme à un ordre donné est bien une fonction algébrico-logarithmique. Le théorème de transfert détaillé dans la section suivante permet de lier le développement asympotique des coefficients de la somme infinie et de sa truncation.
Le théorème de transfert
[modifier | modifier le code]Le théorème de transfert[5] énonce qu'il suffit de connaître le comportement de deux fonctions autour de leur plus petite singularité pour pouvoir comparer le comportement asymptotique de leurs coefficients. L'énoncé est le suivant.
- Soient et ) deux fonctions dont la plus petite singularité est 1. Alors — Si , alors .
— Si , alors .
— Si , alors .
Un exemple
[modifier | modifier le code]On retrouve comme suit l'évaluation asymptotique du nombre d'arbres binaires. On part de l'équation symbolique
- ,
où est réduite à un élément de taille 0 et est composé d'un élément de taille 1. Cette équation se traduit en l’équation
- .
On résout l'équation et on trouve
- .
La fonction a une singularité algébrique en , d'exposant . Autour de , on a
et, par le théorème précédent sur les singularités algébrico-logarithmiques, on obtient
parce que .
Classes combinatoires étiquetées
[modifier | modifier le code]Une classe combinatoire est étiquetée si ses éléments sont étiquetés. Par définition, un tel objet combinatoire, de taille , est de plus doté d'une permutation de . Les exemples les plus pertinents d'objets étiquetés sont les graphes.
Pour énumérer les objets d'une classe étiquetée, on emploie des séries génératrices exponentielles, où les coefficients sont normalisées par une factorielle.
Définition
[modifier | modifier le code]Plus formellement, soit une classe combinatoire étiquetée, et soit , pour , le nombre d'objets de taille dans cette classe. La série génératrice exponentielle associée à est
- .
Il est équivalent d'écrire
- .
L'extraction d'un coefficient de cette série donne
- , donc .
Exemples
[modifier | modifier le code]Permutations. Soit la classe des permutations. Sa série génératrice exponentielle est
- .
Graphes sans arête. Il existe, pour chaque entier n, un seul graphe sans arête. La série génératrice correspondante est
La même série compte les graphes complets.
Graphes cycliques. Le nombre de graphes étiquetés de n sommets formés d'un seul cycle est (n-1)!. Leur série génératrice exponentielle est donc
- .
Constructions
[modifier | modifier le code]Produit
[modifier | modifier le code]La construction d'une somme disjointe de classes combinatoires se transpose sans modifications aux classes étiquetées. Pour le produit, il faut être plus attentif. Soient et deux classes combinatoires étiquetées. Le produit cartésien est formé de couples d'objets étiquetées, mais un tel couple n’est pas correctement étiqueté puisque ses éléments n'ont pas des étiquettes distinctes. On définit une structure associée, dont les éléments ont exactement les étiquettes , et où l'ordre relatif des étiquettes de chaque élément est respecté. On définit
comme l'ensemble des couples ainsi ré-étiquetés. La famille contient exactement éléments. Le produite étiqueté des classes et est par définition
- .
Pour les séries génératrices exponentielles, on a
- .
En effet, pour et , on a
- ,
et donc
- .
Séquence
[modifier | modifier le code]À partir de la somme disjointe et du produit, on construit l'opérateur de séquence comme dans le cas ordinaire : On écrit lorsque est l'ensemble des suites finies d'éléments de ; ici n'a pas d'élément de taille nulle. En d'autres termes,
- ,
ou encore , où les suites son ré-étiquetées. La série génératrices exponentielle est
- .
Ensemble des parties
[modifier | modifier le code]Les définitions d'ensemble et de cycle donnée ici s'appliquent aussi bien aux structures non étiquetées. On définit la classe
comme la classe des parties de la classe contenant éléments. On peut voir cette classe comme la classe quotient de
- ,
où est l’ensemble des suites à éléments de , et où met en équivalence deux suites qui sont les mêmes à une permutation de ses éléments près. On a
- .
La classe des parties de la classe est par définition
- ,
et la série génératrice exponentielle correspondante est
- .
Cycle
[modifier | modifier le code]On définit la classe
comme la classe des cycles de éléments de la classe . On peut la voir comme le quotient de la classe des suites de longueur d'éléments de par l'ensemble des permutations circulaires de ses éléments. On a
- .
La classe des cycles de la classe est par définition
- ,
et la série génératrice exponentielle correspondante est
- .
Deux cas particuliers sont l'opérateur de construction des cycles de longueur paire, et celui de longueur impaire, qui sont respectivement
- et .
Leurs séries génératrices sont respectivement
- et .
Exemples
[modifier | modifier le code]Permutations. Une permutation peut être vue comme un ensemble de cycles de supports disjoints. Ceci conduit à l'équation symbolique
- ,
où est la classe formée d'un seul élément de taille 1. La série génératrice exponentielle est
- .
Involutions. Une involution est une permutation telle que . On peut voir une involution comme un ensemble de cycles de longueur 1 ou 2 à supports disjoints. L'équation symbolique est donc
- ,
et a série génératrice exponentielle est . Un calcul élémentaire permet d'obtenir l'expression close
Dérangements. Un dérangement est une permutation sans point fixe. La définition symbolique est
- ,
et la fonction génératrice exponentielle est
- .
Pour évaluer le nombre d_n de dérangements de taille , on observe que la singularité de est en . Autour de ce point, le développement de est
- , de sorte .
Arbres. Un arbre enraciné est formé d'un sommet et d'un ensemble de sous-arbres. Ce sont des structures étiquetées ou non. Pour les arbres étiquetés, l'équation symbolique est
- ,
et la série exponentielle correspondante est :
- .
Pour un arbre plane enraciné et non étiqueté, formé d'un sommet et d'une suite de sous-arbres, l'équation symbolique est
- ,
et la série génératrice ordinaire est :
- .
Multi-ensemble
[modifier | modifier le code]La construction de la classe des multi-ensembles ou parties avec multiplicité est semblable à celle des parties. Dans la classe
- ,
chaque élément de peut figurer un nombre arbitraire de fois dans une partie. On obtient :
Ceci conduit à la relation (ici est le nombre d'éléments de taille de ) :
Un exemple d'application est constitué des partitions d'entiers. On définit d'abord la classe des entiers positifs, notée ici , où la taille de chaque entier est sa valeur
- .
La série génératrice de iest alors
L'ensemble des partitions d'entiers est la classe des multi-ensembles d'entiers positifs. Si on la note , on obtient donc la formule
La série génératrice de est
Il n'y a pas de formule close connue pour cette série, mais on peut calculer la valeur asymptotique de ses coefficients.
Notes et références
[modifier | modifier le code]- Flajolet et Sedgewick 2008.
- Flajolet et Sedgewick 2008, Chap I, §2.3.
- Flajolet et Sedgewick 2008, Theorem VI.2, p. 385.
- Flajolet et Sedgewick 2008, Figure VI.5, p. 388.
- Flajolet et Sedgewick 2008, Transfer Theorem, Th. VI.3, p. 390.
Bibliographie
[modifier | modifier le code]- 1990 : (en) Herbert Wilf, Generatingfunctionology, Academic Press, 1990, (ISBN 0-12-751955-6). (lire en ligne)
- 1995 : Micha Hofri, Analysis of Algorithms: Computational Methods and Mathematical Tools, Oxford University Press (1995).
- 1998 : François Bergeron, Gilbert Labelle et Pierre Leroux, Combinatorial Species and Tree-like Structures, Cambridge University Press, coll. « Encyclopedia of Mathematics and its Applications » (no 67), , 457 p. (ISBN 978-0-521-57323-8, lire en ligne) — Version française : Théorie des espèces et combinatoire des structures arborescentes, LaCIM, Montréal (1994).
- 2008 : (en) Philippe Flajolet et Robert Sedgewick, Analytic Combinatorics, Cambridge University Press, (ISBN 0-521-89806-4, lire en ligne)
- 2013 Robin Pemantle et Mark C. Wilson, Analytic Combinatorics in Several Variables, Cambridge University Press, coll. « Cambridge Studies in Advanced Mathematics » (no 140), , 392 p. (ISBN 978-1-107-03157-9, lire en ligne).
- 2014 : Jérémie Lumbroso et Basile Morcrette, « A Gentle Introduction to Analytic Combinatorics », dans CIMPA Summer School Analysis of Random Structures, An Najah University, Naplouse, Palestine, 18-27 août 2014 (lire en ligne)
- 2021 : Stephen Melczer, An Invitation to Analytic Combinatorics : From One to Several Variables, Springer, coll. « Texts & Monographs in Symbolic Computation », , xviii 418 (ISBN 978-3-030-67079-5 et 978-3-030-67080-1, présentation en ligne, lire en ligne)
- 2023 : Stephen Melczer, Robin Pemantle et Mark C. Wilson, Analytic Combinatorics in Several Variables : Expanded Second Edition, Cambridge University Press, 2023 (à paraitre), 589 p. (lire en ligne)