Towards camcorder recording robust video fingerprinting

Résumé : Composantes sine qua non des contenus multimédias distribués et/ou partagés via un réseau, les techniques de fingerprinting permettent d'identifier tout contenu numérique à l'aide d'une signature (empreinte) de taille réduite, calculée à partir des données d'origine. Cette signature doit être invariante aux transformations du contenu. Pour des vidéos, cela renvoie aussi bien à du filtrage, de la compression, des opérations géométriques (rotation, sélection de sous-région… ) qu'à du sous-échantillonnage spatio-temporel. Dans la pratique, c'est l'enregistrement par caméscope directement dans une salle de projection qui combine de façon non linéaire toutes les transformations pré-citées.Par rapport à l'état de l'art, sous contrainte de robustesse à l'enregistrement en salle de cinéma, trois verrous scientifiques restent à lever : (1) unicité des signatures, (2) appariement mathématique des signatures, (3) scalabilité de la recherche au regard de la dimension de la base de données.La principale contribution de cette thèse est de spécifier, concevoir, implanter et valider TrackART, une nouvelle méthode de traçage des contenus vidéo relevant ces trois défis dans un contexte de traçage de contenus cinématographiques.L'unicité de la signature est obtenue par sélection d'un sous-ensemble de coefficients d'ondelettes, selon un critère statistique de leurs propriétés. La robustesse des signatures aux distorsions lors de l'appariement est garantie par l'introduction d'un test statistique Rho de corrélation. Enfin, la méthode développée est scalable : l'algorithme de localisation met en œuvre une représentation auto-adaptative par sac de mots visuels. TrackART comporte également un mécanisme de synchronisation supplémentaire, capable de corriger automatiquement le jitter introduit par les attaques de désynchronisation variables en temps.La méthode TrackART a été validée dans le cadre d'un partenariat industriel, avec les principaux professionnels de l'industrie cinématographique et avec le concours de la Commission Technique Supérieure de l'Image et du Son. La base de données de référence est constituée de 14 heures de contenu vidéo. La base de données requête correspond à 25 heures de contenu vidéo attaqué, obtenues en appliquant neuf types de distorsion sur le tiers des vidéo de la base de référence.Les performances de la méthode TrackART ont été mesurées objectivement dans un contexte d'enregistrement en salle : la probabilité de fausse alarme est inférieure à 16*10^-6, la probabilité de perte inférieure à 0,041, la précision et le rappel sont égal à 93%. Ces valeurs représentent une avancée par rapport à l'état de l'art qui n'exhibe aucune méthode de traçage robuste à l'enregistrement en salle et valident une première preuve de concept de la méthodologie statistique développée.
Type de document :
Thèse
Other [cs.OH]. Ecole Nationale Supérieure des Mines de Paris, 2012. English. 〈NNT : 2012ENMP0097〉
Liste complète des métadonnées

Littérature citée [158 références]  Voir  Masquer  Télécharger

https://pastel.archives-ouvertes.fr/pastel-00871762
Contributeur : Abes Star <>
Soumis le : jeudi 10 octobre 2013 - 13:42:09
Dernière modification le : lundi 12 novembre 2018 - 10:55:33
Document(s) archivé(s) le : samedi 11 janvier 2014 - 04:20:33

Fichier

2012ENMP0097.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : pastel-00871762, version 1

Collections

Citation

Adriana Garboan. Towards camcorder recording robust video fingerprinting. Other [cs.OH]. Ecole Nationale Supérieure des Mines de Paris, 2012. English. 〈NNT : 2012ENMP0097〉. 〈pastel-00871762〉

Partager

Métriques

Consultations de la notice

545

Téléchargements de fichiers

941