Fusion multi-niveaux pour l'indexation et la recherche multimédia par le contenu sémantique

Résumé : Aujourd'hui, l'accès aux documents dans les bases de données, d'archives et sur Internet s'effectue principalement grâce à des données textuelles : nom de l'image ou mots-clés. Cette recherche est non exempte de fautes plus ou moins graves : omission, orthographe, etc. Les progrès effectués dans le domaine de l'analyse d'images et de l'apprentissage automatique permettent d'apporter des solutions comme l'indexation et la recherche à base des caractéristiques telles que la couleur, la forme, la texture, le mouvement, le son et le texte. Ces caractéristiques sont riches en informations et notamment d'un point de vue sémantique. Cette thèse s'inscrit dans le cadre de l'indexation automatique par le contenu sémantique des documents multimédia: plans vidéo et images-clés. L'indexation consiste à extraire, représenter et organiser efficacement le contenu des documents d'une base de données. L'état de l'art du domaine est confronté au «fossé sémantique» qui sépare les représentations visuelles brutes (bas-niveau) et conceptuelles (haut-niveau). Pour limiter les conséquences de cette problématique, nous avons introduit dans le système plusieurs types de descripteurs, tout en prenant à notre avantage les avancées scientifiques dans le domaine de l'apprentissage automatique et de la ``fusion multi-niveaux''. En effet, la fusion est utilisée dans le but de combiner des informations hétérogènes issues de plusieurs sources afin d'obtenir une information globale, plus complète, de meilleure qualité, permettant de mieux décider et d'agir. Elle peut être appliquée sur plusieurs niveaux du processus de classification. Dans cette thèse, nous avons étudié la fusion bas-niveau (précoce), la fusion haut-niveau (tardive), ainsi qu'à un niveau décisionnel basé sur l'ontologie et la similarité inter-concepts dit de raisonnement. Les systèmes proposés ont été validés sur les données de TRECVid (projet NoE K-Space) et les vidéos de football issues d'Orange-France Télécom Labs (projet CRE-Fusion). Les résultats révèlent l'importance de la fusion sur chaque niveau du processus de classification, en particulier, l'usage de la théorie des évidences.
Type de document :
Thèse
domain_other. Télécom ParisTech, 2009. English
Domaine :
Liste complète des métadonnées

Littérature citée [171 références]  Voir  Masquer  Télécharger

https://pastel.archives-ouvertes.fr/pastel-00005321
Contributeur : Ecole Télécom Paristech <>
Soumis le : mercredi 7 juillet 2010 - 08:00:00
Dernière modification le : mardi 23 janvier 2018 - 16:50:46
Document(s) archivé(s) le : vendredi 8 octobre 2010 - 09:48:51

Identifiants

  • HAL Id : pastel-00005321, version 1

Citation

Rachid Benmokhtar. Fusion multi-niveaux pour l'indexation et la recherche multimédia par le contenu sémantique. domain_other. Télécom ParisTech, 2009. English. 〈pastel-00005321〉

Partager

Métriques

Consultations de la notice

342

Téléchargements de fichiers

1658