Wavelets and advanced spatio-temporal decompositions with an application to scalable video coding - Archive ouverte HAL Access content directly
Theses Year : 2006

Wavelets and advanced spatio-temporal decompositions with an application to scalable video coding

Ondelettes et décompositions spatio-temporelles avancées; application au codage vidéo scalable

(1)
1

Abstract

Some of the most powerful schemes for scalable video coding are based on the recent t+2D paradigm, which has been shown to outperform the best hybrid video codecs. In these schemes, temporal redundancy is first exploited through a motion-compensated multiresolution decomposition and the resulting temporal subband frames are then spatially decomposed with a wavelet transform. My research works consist in designing wavelet-based and non-linear scalable decompositions, able to efficiently capture the spatio-temporal redundancy present in video sequences. The following main directions have been followed. First, we show how we can design highly efficient temporal lifted transforms, in order to improve the coding gain of the underlying video codec. We then investigate into M-band filters banks, used to spatially decompose the temporal subbands and show how their scalability features can be extended to non-dyadic factors. At last, we present some reversible and adaptive wavelet decompositions that can efficiently capture the directional nature of images without transmitting any side information.
Les progrès récents sur les schémas de codage vidéo par ondelettes ont permis l'apparition d'une nouvelle génération de codeurs vidéos scalables t+2D dont l'efficacité est comparable à celle des meilleurs codecs hybrides. Ces schémas reposent sur l'utilisation d'une transformée en ondelettes appliquée le long du mouvement des images afin d'exploiter leur redondance temporelle, suivie d'une décomposition spatiale des sous-bandes résultantes et d'un codage entropique. L'objectif de cette thèse consiste en l'étude et la construction de nouvelles transformées scalables mises en jeu dans le schéma de codage vidéo t+2D, afin d'en améliorer l'efficacité de codage. L'utilisation du formalisme lifting lors de la construction de ces transformées spatio-temporelles permet l'introduction d'opérateurs non-linéaires, particulièrement utiles pour représenter efficacement les singularités et discontinuités présentes dans une séquence vidéo. Dans un premier temps, nous nous intéressons à l'optimisation et la construction de nouvelles transformées temporelles compensées en mouvement, afin d'améliorer leur performance de décorrelation. Nous étudions alors la construction de filtres M-bandes pour décomposer spatialement les sous-bande temporelles et nous montrons comment les propriétés de scalabilité des bancs de synthèse M-bandes peuvent être étendues à des facteurs rationnels quelconques. Enfin, nous décrivons comment mettre en oeuvre des décompositions spatiales en ondelettes adaptatives, non-linéaires et inversibles, sans nécessiter la transmission d'une carte de décisions.
Fichier principal
Vignette du fichier
these.pdf (7.09 Mo) Télécharger le fichier
Loading...

Dates and versions

pastel-00002189 , version 1 (16-11-2010)

Identifiers

  • HAL Id : pastel-00002189 , version 1

Cite

Grégoire Pau. Ondelettes et décompositions spatio-temporelles avancées; application au codage vidéo scalable. domain_other. Télécom ParisTech, 2006. Français. ⟨NNT : ⟩. ⟨pastel-00002189⟩
191 View
1340 Download

Share

Gmail Facebook Twitter LinkedIn More