Indexation et recherche de contenus par objet visuel

Résumé : La question de recherche des objets vidéo basés sur le contenu lui-même, est de plus en plus difficile et devient un élément obligatoire pour les moteurs de recherche vidéo. Cette thèse présente un cadre pour la recherche des objets vidéo définis par l'utilisateur et apporte deux grandes contributions. La première contribution, intitulée DOOR (Dynamic Object Oriented Retrieval), est un cadre méthodologique pour la recherche et récupération des instances d'objets vidéo sélectionnés par un utilisateur, tandis que la seconde contribution concerne le support offert pour la recherche des vidéos, à savoir la navigation dans les vidéo, le système de récupération de vidéos et l'interface avec son architecture sous-jacente.Dans le cadre DOOR, l’objet comporte une représentation hybride obtenues par une sur-segmentation des images, consolidé avec la construction des graphs d’adjacence et avec l’agrégation des points d'intérêt. L'identification des instances d'objets à travers plusieurs vidéos est formulée comme un problème d’optimisation de l'énergie qui peut approximer un tache NP-difficile. Les objets candidats sont des sous-graphes qui rendent une énergie optimale vers la requête définie par l'utilisateur. Quatre stratégies d'optimisation sont proposées: Greedy, Greedy relâché, recuit simulé et GraphCut. La représentation de l'objet est encore améliorée par l'agrégation des points d'intérêt dans la représentation hybride, où la mesure de similarité repose sur une technique spectrale intégrant plusieurs types des descripteurs. Le cadre DOOR est capable de s’adapter à des archives vidéo a grande échelle grâce à l'utilisation de représentation sac-de-mots, enrichi avec un algorithme de définition et d’expansion de la requête basée sur une approche multimodale, texte, image et vidéo. Les techniques proposées sont évaluées sur plusieurs corpora de test TRECVID et qui prouvent leur efficacité.La deuxième contribution, OVIDIUS (On-line VIDeo Indexing Universal System) est une plate-forme en ligne pour la navigation et récupération des vidéos, intégrant le cadre DOOR. Les contributions de cette plat-forme portent sur le support assuré aux utilisateurs pour la recherche vidéo - navigation et récupération des vidéos, interface graphique. La plate-forme OVIDIUS dispose des fonctionnalités de navigation hiérarchique qui exploite la norme MPEG-7 pour la description structurelle du contenu vidéo. L'avantage majeur de l'architecture propose c’est sa structure modulaire qui permet de déployer le système sur terminaux différents (fixes et mobiles), indépendamment des systèmes d'exploitation impliqués. Le choix des technologies employées pour chacun des modules composant de la plate-forme est argumentée par rapport aux d'autres options technologiques.
Type de document :
Thèse
Autre [cs.OH]. Ecole Nationale Supérieure des Mines de Paris, 2012. Français. 〈NNT : 2012ENMP0096〉
Liste complète des métadonnées

Littérature citée [222 références]  Voir  Masquer  Télécharger

https://pastel.archives-ouvertes.fr/pastel-00873966
Contributeur : Abes Star <>
Soumis le : mercredi 16 octobre 2013 - 18:03:58
Dernière modification le : lundi 12 novembre 2018 - 10:54:46
Document(s) archivé(s) le : vendredi 17 janvier 2014 - 04:42:44

Fichier

2012ENMP0096.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : pastel-00873966, version 1

Collections

Citation

Andrei Bursuc. Indexation et recherche de contenus par objet visuel. Autre [cs.OH]. Ecole Nationale Supérieure des Mines de Paris, 2012. Français. 〈NNT : 2012ENMP0096〉. 〈pastel-00873966〉

Partager

Métriques

Consultations de la notice

865

Téléchargements de fichiers

1233