Lip Analysis for Person recognition

Résumé : Dans cette thèse nous nous concentrons sur une caractéristique locale du visage humain que sont les lèvres en termes de pertinence et influence sur la reconnaissance de la personne. Une étude détaillée est réalisée à l'égard de différentes étapes, telles que la détection, l'évaluation, la normalisation et les applications liées de la bouche. Au départ, on présente un algorithme de détection des lèvres en fusionnant deux méthodes indépendantes. La première méthode est basée sur la détection de contours et la deuxième orientée sur la segmentation. On exploite leurs points forts en combinant les deux méthodes par fusion. Ensuite, on extrait les caractéristiques qui modélisent l'aspect comportemental du mouvement des lèvres lorsque la personne parle afin de les exploiter pour la reconnaissance des personnes. Les caractéristiques du comportement incluent des caractéristiques statiques, et des caractéristiques dynamiques en fonction du flux optique. Ces caractéristiques sont utilisées pour construire le modèle du client par une Mixture de Gaussiennes et enfin la classification est réalisée en utilisant une règle de décision bayésienne. Enfin, on propose une méthode de normalisation temporelle pour le traitement des variations du mouvement des lèvres pendant le discours. Étant donné plusieurs vidéos où une personne répète la même phrase plusieurs fois, nous étudions le mouvement des lèvres dans l'une de ces vidéos et on sélectionne certaines images clés comme images de synchronisation. Après, on synchronise le reste des vidéos par rapport au images clés de la première vidéo. Enfin toutes les vidéos sont normalisées temporellement par interpolation à l'aide de "morphing".
Type de document :
Thèse
Signal and Image processing. Télécom ParisTech, 2010. English
Liste complète des métadonnées

Littérature citée [250 références]  Voir  Masquer  Télécharger

https://pastel.archives-ouvertes.fr/pastel-00005849
Contributeur : Ecole Télécom Paristech <>
Soumis le : vendredi 5 mars 2010 - 08:00:00
Dernière modification le : jeudi 11 janvier 2018 - 06:23:38
Document(s) archivé(s) le : jeudi 30 mars 2017 - 05:10:51

Identifiants

  • HAL Id : pastel-00005849, version 1

Citation

Usman Saeed. Lip Analysis for Person recognition. Signal and Image processing. Télécom ParisTech, 2010. English. 〈pastel-00005849〉

Partager

Métriques

Consultations de la notice

768

Téléchargements de fichiers

1139