Segmentation et structuration d'un document vidéo pour la caractérisation et l'indexation de son contenu sémantique

Résumé : La multitude de documents multimédia déjà existants ou créés chaque jour nous confronte au problème de la recherche d' informations au sein de bases de données gigantesques qui rendent toute volonté d'indexation entièrement manuelle impossible. Dans ce contexte il est devenu nécessaire de concevoir et de construire des outils capables sinon d' extraire tout le contenu sémantique d'un document donné du moins d' en élaborer une première structuration de manière automatique. En se restreignant aux documents vidéo, cette thèse se propose donc de bâtir des outils automatiques réalisant une structuration en deux étapes. Tout d'abord linéaire, elle aboutit à un découpage d'un document vidéo en entités allant de la scène à l'image en passant par la prise de vue et le morceau de prise de vue. Puis relationnelle, elle consiste en l'extraction de relations par la mise en évidence de liens syntaxiques ou sémantiques de tout ordre entre deux entités de types quelconques. En plus de leur caractère général et automatique, l'ensemble des outils que nous présentons sont, en outre, conçus dans le respect d'une méthodologie précise. Cette dernière consiste à n'utiliser que des critères simples et de bas niveau de traitements d'images et tout particulièrement de morphologie mathématique qui combinés entre eux et avec des règles logiques de décision permettent déjà d'atteindre une structuration cohérente efficace et représentative d'un contenu informationnel de niveau sémantique élevé. Ce choix induit de plus une grande rapidité de nos outils puisque dans leur ensemble leur temps d'exécution est inférieur au temps réel. Leur validation est obtenue au travers de nombreux exemples et applications appartenant essentiellement à la classe des journaux télévisés.
Type de document :
Thèse
Mathematics [math]. École Nationale Supérieure des Mines de Paris, 2000. English
Liste complète des métadonnées

https://pastel.archives-ouvertes.fr/pastel-00003303
Contributeur : Ecole Mines Paristech <>
Soumis le : jeudi 24 janvier 2008 - 08:00:00
Dernière modification le : mardi 29 septembre 2015 - 10:32:46
Document(s) archivé(s) le : mercredi 8 septembre 2010 - 17:50:05

Identifiants

  • HAL Id : pastel-00003303, version 1

Collections

Citation

Claire-Hélène Demarty. Segmentation et structuration d'un document vidéo pour la caractérisation et l'indexation de son contenu sémantique. Mathematics [math]. École Nationale Supérieure des Mines de Paris, 2000. English. <pastel-00003303>

Partager

Métriques

Consultations de
la notice

492

Téléchargements du document

1072