Champ aléatoire conditionnel

Les champs aléatoires conditionnels (conditional random fields ou CRFs) sont une classe de modèles statistiques utilisés en reconnaissance des formes et plus généralement en apprentissage statistique. Les CRFs permettent de prendre en compte l'interaction de variables « voisines ». Ils sont souvent utilisés pour des données séquentielles (langage naturel, séquences biologiques, vision par ordinateur).

Les CRFs sont un exemple de réseau probabiliste non orienté. Il s'agit d'une version de type modèle discriminant des champs aléatoires de Markov généralement présentés comme des modèles discriminatifs, c'est-à-dire que l'on cherche à modéliser la probabilité conditionnelle $p({\boldsymbol {Y}}|{\boldsymbol {X}})$ , ${\boldsymbol {X}}$ étant les observations et ${\boldsymbol {Y}}$ les variables à estimer, au lieu de $p({\boldsymbol {Y}},{\boldsymbol {X}})$ .

Description

Un CRF est défini par Lafferty, McCallum et Pereira^[1] comme suit.

Soit $G=(V,E)$ un graphe. ${\boldsymbol {Y}}$ est indexé par les nœuds ( $v$ pour vertices) de $G$ : ${\boldsymbol {Y}}=({\boldsymbol {Y}}_{v})_{v\in V}$ . On dit que $({\boldsymbol {X}},{\boldsymbol {Y}})$ est un champ aléatoire conditionnel si les variables aléatoires ${\boldsymbol {Y}}_{v}$ conditionnées à ${\boldsymbol {X}}$ obéissent à la propriété de Markov :
$p({\boldsymbol {Y}}_{v}|{\boldsymbol {X}},{\boldsymbol {Y}}_{w},w\neq v)=p({\boldsymbol {Y}}_{v}|{\boldsymbol {X}},{\boldsymbol {Y}}_{w},w\sim v)$ , où ${\mathit {w}}\sim v$ signifie que $w$ et $v$ sont des voisins dans $G$ .

Ici la propriété de Markov signifie que la probabilité de chaque variable ${\boldsymbol {Y}}_{v}$ ne dépend que des valeurs en les voisins de $v$ .

Références

↑ Conditional random fields: Probabilistic models for segmenting and labeling sequence data, Lafferty, J., McCallum, A., Pereira, F., Proc. 18th International Conf. on Machine Learning, Morgan Kaufmann, p. 282–289, 2001

Portail des probabilités et de la statistique

[Laf:McC:Per01-1] Conditional random fields: Probabilistic models for segmenting and labeling sequence data, Lafferty, J., McCallum, A., Pereira, F., Proc. 18th International Conf. on Machine Learning, Morgan Kaufmann, p. 282–289, 2001

[1]