Méthodes de géométrie de l'information pour les modèles de mélange - PASTEL - Thèses en ligne de ParisTech Accéder directement au contenu
Thèse Année : 2013

Information-geometric methods for mixture models

Méthodes de géométrie de l'information pour les modèles de mélange

Résumé

This thesis presents new methods for mixture model learning based on information geometry. We focus on mixtures of exponential families, which encompass a large number of mixtures used in practice. With information geometry, statistical problems can be studied with geometrical tools. This framework gives new perspectives allowing to design algorithms which are both fast and generic. Two main contributions are proposed here. The first one is a method for simplification of kernel density estimators. This simplification is made with clustering algorithms, first with the Bregman divergence and next, for speed reason, with the Fisher-Rao distance and model centroids. The second contribution is a generalization of the k-MLE algorithm which allows to deal with mixtures where all the components do not belong to the same family: this method is applied to mixtures of generalized Gaussians and of Gamma laws and is faster than existing methods. The description of this two algorithms comes with a complete software implementation and their efficiency is evaluated through applications in bio-informatics and texture classification.
Cette thèse présente de nouvelles méthodes pour l'apprentissage de modèles de mélanges basées sur la géométrie de l'information. Les modèles de mélanges considérés ici sont des mélanges de familles exponentielles, permettant ainsi d'englober une large part des modèles de mélanges utilisés en pratique. Grâce à la géométrie de l'information, les problèmes statistiques peuvent être traités avec des outils géométriques. Ce cadre offre de nouvelles perspectives permettant de mettre au point des algorithmes à la fois rapides et génériques. Deux contributions principales sont proposées ici. La première est une méthode de simplification d'estimateurs par noyaux. Cette simplification est effectuée à l'aide un algorithme de partitionnement, d'abord avec la divergence de Bregman puis, pour des raisons de rapidité, avec la distance de Fisher-Rao et des barycentres modèles. La seconde contribution est une généralisation de l'algorithme k-MLE permettant de traiter des mélanges où toutes les composantes ne font pas partie de la même famille: cette méthode est appliquée au cas des mélanges de Gaussiennes généralisées et des mélanges de lois Gamma et est plus rapide que les méthodes existantes. La description de ces deux méthodes est accompagnée d'une implémentation logicielle complète et leur efficacité est évaluée grâce à des applications en bio-informatique et en classification de textures.
Fichier principal
Vignette du fichier
these.pdf (1.31 Mo) Télécharger le fichier
Loading...

Dates et versions

pastel-00931722 , version 1 (15-01-2014)

Identifiants

  • HAL Id : pastel-00931722 , version 1

Citer

Olivier Schwander. Méthodes de géométrie de l'information pour les modèles de mélange. Apprentissage [cs.LG]. Ecole Polytechnique X, 2013. Français. ⟨NNT : ⟩. ⟨pastel-00931722⟩
729 Consultations
1350 Téléchargements

Partager

Gmail Facebook X LinkedIn More