Multipitch estimation methods for the separation of speech and musical signals - PASTEL - Thèses en ligne de ParisTech Accéder directement au contenu
Thèse Année : 2003

Multipitch estimation methods for the separation of speech and musical signals

Estimation de fréquences fondamentales multiples. Application à la séparation de signaux de parole et de musique

Résumé

This thesis deals with the multipitch estimation problem for speech and musical mixtures where the number of sources is unknown. In the speech context, we propose an iterative method which successively estimates the pitches. The complex "voiced/unvoiced" nature of the mixtures is characterized by a two-part model which consists in "sums of harmonic sinusoids + autoregressive process". The pitch estimation is based on the maximization of a penalized likelihood term. This likelihood also allows to define a voicing detector used to estimate the number of sources. In the musical context, we propose three new methods which simultaneously determine the pitches. Based on a spectral peak classification of the mixture, they differ by the classification technique. All the methods allow to estimate the number of sources. Moreover they are able to take into account the spectral overlaps which characterize the musical mixtures and can be used on musical chords.
L'objet de cette thèse est l'étude du problème d'estimation de fréquences fondamentales multiples, pour des mélanges de parole et de musique dont le nombre de sources est inconnu. Dans le cadre de la parole, nous proposons une méthode itérative qui estime successivement les fréquences fondamentales. La nature «voisée/non-voisée» des mélanges est caractérisée par un modèle du type "sommes de sinusoïdes harmoniques + bruit autorégressif". L'estimation consiste à maximiser un terme de Vraisemblance pénalisée qui permet également d'estimer le nombre de sources. Dans le cadre musical, nous proposons trois nouvelles méthodes qui estiment simultanément les fréquences fondamentales. Basées sur une classification des pics spectraux du mélange, elles diffèrent par leur technique de classification. Toutes permettent d'estimer le nombre de sources. Elles permettent également de prendre en compte les recouvrements spectraux entre notes et sont ainsi applicables au traitement d'accords musicaux.
Fichier principal
Vignette du fichier
essai.pdf (20.15 Mo) Télécharger le fichier

Dates et versions

pastel-00000723 , version 1 (24-09-2004)

Identifiants

  • HAL Id : pastel-00000723 , version 1

Citer

Julie Rosier. Multipitch estimation methods for the separation of speech and musical signals. domain_other. Télécom ParisTech, 2003. English. ⟨NNT : ⟩. ⟨pastel-00000723⟩
170 Consultations
605 Téléchargements

Partager

Gmail Facebook X LinkedIn More