Segmentation et structuration d'un document vidéo pour la caractérisation et l'indexation de son contenu sémantique - PASTEL - Thèses en ligne de ParisTech Accéder directement au contenu
Thèse Année : 2000

Segmentation et structuration d'un document vidéo pour la caractérisation et l'indexation de son contenu sémantique

Claire-Hélène Demarty
  • Fonction : Auteur

Résumé

Due to the large amount of multimedia documents either already existing or produced daily, we are faced with the problem of retrieving information from gigantic databases for which a purely manual indexing process is currently impossible. In this context, it has become necessary to design new techniques if not to extract the whole semantic content of a given document but at least to produce a first structure of it automatically. Dealing only with video documents, this thesis therefore proposes to build automatic tools that create such a structure in two steps As a result of the first linear part of the structuring, the video document is splitted into different entities that go from the scene to the object, through the shot, the part of shot and the key frame. The second and relational step consists in extracting relationships by establishing all kinds of semantic and syntactic links between the different types of entities. In addition to being general and automatic, the tools proposed were elaborated with respect to a precise methodology. According to this methodology, we only use simple and low level image processing criteria and in particular these from mathematical morphology. These criteria when combined together and also with logical rules of decision already enable us to obtain a structure which is consistent, efficient and representative of a content with a high semantic level. The choice of this methodology also leads to a very high speed as our tools work faster than real time. These tools are validated through numerous examples and applications based mainly on television news broadcasts documents.
La multitude de documents multimédia déjà existants ou créés chaque jour nous confronte au problème de la recherche d' informations au sein de bases de données gigantesques qui rendent toute volonté d'indexation entièrement manuelle impossible. Dans ce contexte il est devenu nécessaire de concevoir et de construire des outils capables sinon d' extraire tout le contenu sémantique d'un document donné du moins d' en élaborer une première structuration de manière automatique. En se restreignant aux documents vidéo, cette thèse se propose donc de bâtir des outils automatiques réalisant une structuration en deux étapes. Tout d'abord linéaire, elle aboutit à un découpage d'un document vidéo en entités allant de la scène à l'image en passant par la prise de vue et le morceau de prise de vue. Puis relationnelle, elle consiste en l'extraction de relations par la mise en évidence de liens syntaxiques ou sémantiques de tout ordre entre deux entités de types quelconques. En plus de leur caractère général et automatique, l'ensemble des outils que nous présentons sont, en outre, conçus dans le respect d'une méthodologie précise. Cette dernière consiste à n'utiliser que des critères simples et de bas niveau de traitements d'images et tout particulièrement de morphologie mathématique qui combinés entre eux et avec des règles logiques de décision permettent déjà d'atteindre une structuration cohérente efficace et représentative d'un contenu informationnel de niveau sémantique élevé. Ce choix induit de plus une grande rapidité de nos outils puisque dans leur ensemble leur temps d'exécution est inférieur au temps réel. Leur validation est obtenue au travers de nombreux exemples et applications appartenant essentiellement à la classe des journaux télévisés.
Fichier principal
Vignette du fichier
these_demarty.pdf (10.48 Mo) Télécharger le fichier
Loading...

Dates et versions

pastel-00003303 , version 1 (24-01-2008)

Identifiants

  • HAL Id : pastel-00003303 , version 1

Citer

Claire-Hélène Demarty. Segmentation et structuration d'un document vidéo pour la caractérisation et l'indexation de son contenu sémantique. Mathematics [math]. École Nationale Supérieure des Mines de Paris, 2000. English. ⟨NNT : ⟩. ⟨pastel-00003303⟩
8076 Consultations
1114 Téléchargements

Partager

Gmail Facebook X LinkedIn More