Unsupervised TV program structuring - Archive ouverte HAL Access content directly
Theses Year : 2013

Unsupervised TV program structuring

Structuration intra-programme de contenus TV

(1)
1

Abstract

TV programs have an underlying structure that is lost when these are broadcasted. The linear mode is the only available reading mode when viewing programs recorded using a Personal Video Recorder or through a TV-on-Demand service. The fast-forward/backward functions are the only available tools for browsing. In this context, program structuring becomes important in order to provide users with novel and useful browsing features. In addition to advanced browsing features, TV program structuring can also be used for summarization, indexing and querying, archiving, etc. This thesis addresses the problem of unsupervised TV program structuring. The idea is to automatically recover the original structure of the program by finding the start time of each part composing it. The proposed approach is completely unsupervised and addresses a large category of programs like TV games, magazines, news…. It is based on the detection of “separators” which are short audio/visual sequences that delimit the different parts of a program. To do so, audio and visual recurrences are first detected from a set of episodes of a same program. In order to extract the separators, the recurrences are then classified using decision trees. These are built based on attributes issued from techniques like applause detection, scenes segmentation, face and speaker detection and clustering.
Les programmes TV possède une structure qui, en général, est perdue quand les programmes sont diffusés. Les programmes qui ont été enregistrés via un enregistreur vidéo personnel ou disponibles via des services comme la TV à la demande, ne peuvent être visionnés que d’une façon linéaire. La navigation y est réalisée en utilisant les fonctions basiques d’avance/retour rapide. Dans ce contexte, la structuration automatique de programmes TV apporte une solution originale. En retrouvant la structure d’origine du programme, elle permet d’offrir aux utilisateurs des outils de navigation originaux. Elle peut également servir pour d’autres applications comme la construction des résumés vidéo, l’indexation et la recherche…Cette thèse s’intéresse ainsi à la structuration automatique des programmes TV. L’objectif est de retrouver automatiquement la structure d’origine d’un programme en déterminant le début et la fin de chaque partie qui le compose. L’approche proposée est complètement non-supervisée et adresse une large catégorie de programmes TV comme les jeux, les magazines, les journaux TV… Cette approche exploite les « séparateurs » qui sont de séquences courtes insérées dans les programmes pour en délimiter les différentes parties. Pour cela, une détection des récurrences audio et visuelles est réalisée sur un ensemble d’épisodes du même programme. Ces récurrences sont ensuite classées à l’aide d’arbres de décision pour en extraire les séparateurs. Les attributs utilisés pour la construction des arbres de décision porte sur la détection des applaudissements, la segmentation en scènes, la détection et le clustering des visages et des locuteurs.
Fichier principal
Vignette du fichier
theseAbduramanV2.pdf (41.96 Mo) Télécharger le fichier
Origin : Version validated by the jury (STAR)

Dates and versions

tel-01136587 , version 1 (27-03-2015)

Identifiers

  • HAL Id : tel-01136587 , version 1

Cite

Alina Elma Abduraman. Unsupervised TV program structuring. Other. Télécom ParisTech, 2013. English. ⟨NNT : 2013ENST0027⟩. ⟨tel-01136587⟩
142 View
60 Download

Share

Gmail Facebook Twitter LinkedIn More