Modélisation sinusoïdale et applications à l'indexation sonore - Archive ouverte HAL Access content directly
Theses Year : 2008

Modélisation sinusoïdale et applications à l'indexation sonore

(1)
1

Abstract

The aim of the thesis is the analysis of digital audio signals based on sinusoidal modelling. The first part of the thesis is dedicated to the estimation of sinusoidal parameters, and in particular to the methods based on the Fourier transform. The advantages of this family of methods are low algorithmic complexity and ease of use. A complete state of the art of the sinusoidal estimation methods based on the Fourier transform is presented. Then, the new estimators that were developed during the thesis are detailed, in particular two new methods dedicated to the estimation of all the parameters of a sine wave modulated in both magnitude and frequency, and whose performances have proven better than the only equivalent method of the state of the art, the quadratically interpolated Fourier transform (QIFFT). Sound indexation is a fairly large research field which issue is to meet the needs of access by the content for audio material. In the second part of the thesis we have applied the sinusoidal modelling on two audio indexing tasks for which this model is particularly appropriate: pitch estimation and detection of audio objects. The two developed algorithms involve similar principles: a matching between sinusoidal peaks estimated in the audio stream and those of the referring sound object, and a measure of likelihood of the match.
L'objectif de la thèse est l'analyse des signaux audio-numériques basée sur la modélisation sinusoïdale. La première partie de la thèse est dédiée à l'estimation des paramètres sinusoïdaux, et en particulier aux méthodes basées sur la transformée de Fourier. Les avantages de cette famille de méthodes sont une faible complexité algorithmique et une grande facilité d'utilisation. Un état de l'art complet des méthodes d'estimation sinusoïdale basées sur la transformée de Fourier est présenté. Nous parlons ensuite des nouveaux estimateurs qui ont été développé pendant la thèse, en particulier deux nouvelles méthodes qui permettent d'estimer tous les paramètres d'une sinusoïde modulée à la fois en amplitude et en fréquence, et dont les performances se sont révélées meilleures que la seule méthode équivalente de l'état de l'art existante, l'interpolation quadratique de la transformée de Fourier (QIFFT). L'indexation sonore est un domaine assez vaste dont la problématique est de répondre aux besoins d'accès par le contenu des documents audio. Dans la deuxième partie de la thèse nous nous sommes attachés à appliquer la modélisation sinusoïdale à deux tâches d'indexation audio pour lesquelles cette modélisation est particulièrement adaptée: l'estimation de pitch et la détection d'objets sonores. Les deux algorithmes développés font intervenir des principes similaires : un appariement des pics sinusoïdaux estimés dans le flux audio avec ceux de l'objet sonore de référence, ainsi qu'une mesure de vraisemblance de l'appariement.
Fichier principal
Vignette du fichier
These_Michael_Betser_v2.pdf (3.38 Mo) Télécharger le fichier
Loading...

Dates and versions

pastel-00004089 , version 1 (09-01-2009)

Identifiers

  • HAL Id : pastel-00004089 , version 1

Cite

Michaël A. Betser. Modélisation sinusoïdale et applications à l'indexation sonore. Mathematics [math]. Télécom ParisTech, 2008. English. ⟨NNT : ⟩. ⟨pastel-00004089⟩
166 View
5748 Download

Share

Gmail Facebook Twitter LinkedIn More