Détection de textes enfouis dans des bases d'images généralistes : un descripteur sémantique pour l'indexation

Résumé : Les bases de données multimédia, aussi bien personnelles que professionnelles, se développent considérablement et les outils automatiques pour leur gestion efficace deviennent indispensables. L'effort des chercheurs pour développer des outils d'indexation basés sur le contenu sont très importants, mais le fossé sémantique est difficile à franchir : les descripteurs de bas niveau généralement utilisés montrent leurs limites dans des cadres applicatifs de plus en plus ouverts. Le texte présent dans les images est souvent relié au contexte sémantique et constitue un descripteur pertinent. Dans cette thèse nous proposons un système de localisation de texte dans des bases d'images génériques, qui tend à être robuste au changement d'échelle et aux déformations usuelles du texte enfoui. Notre système est basé sur un opérateur résiduel numérique, l'ouvert ultime. Dans une première partie nous étudions le comportement de cet opérateur sur des images réelles, et proposons des solutions pour pallier certaines limitations. Dans une seconde partie l'opérateur est inclus dans une chaîne de traitement et complété par différents outils de caractérisation du texte. Les performances de notre approche sont évaluées sur deux bases d'images. Premièrement, nous avons pris part à la campagne d'évaluation ImagEval, remportant la première place dans la catégorie "localisation de texte". Deuxièmement pour situer notre approche par rapport à l'état de l'art, nous avons effectué des tests avec la base d'évaluation I.C.D.A.R. Enfin, un démonstrateur a été réalisé pour EADS. Pour des raisons de confidentialité, ces travaux n'ont pas pu être intégrés à ce manuscrit.
Type de document :
Thèse
domain_other. École Nationale Supérieure des Mines de Paris, 2007. Français. <NNT : 2007ENMP1511>
Liste complète des métadonnées

https://pastel.archives-ouvertes.fr/pastel-00003782
Contributeur : Ecole Mines Paristech <>
Soumis le : lundi 2 juin 2008 - 08:00:00
Dernière modification le : mercredi 28 septembre 2016 - 15:39:06
Document(s) archivé(s) le : vendredi 10 septembre 2010 - 12:33:03

Identifiants

  • HAL Id : pastel-00003782, version 1

Collections

Citation

Thomas Retornaz. Détection de textes enfouis dans des bases d'images généralistes : un descripteur sémantique pour l'indexation. domain_other. École Nationale Supérieure des Mines de Paris, 2007. Français. <NNT : 2007ENMP1511>. <pastel-00003782>

Partager

Métriques

Consultations de
la notice

426

Téléchargements du document

2150