Quelques Contributions au Traitement de Signal Musical et à la Séparation Aveugle de Source Audio Mono-Microphone

Antony Schutz

Thèse Année : 2010

Some Contributions to Music Signal Processing and to Mono-Microphone Blind Audio Source Separation

Quelques Contributions au Traitement de Signal Musical et à la Séparation Aveugle de Source Audio Mono-Microphone

(1, 2)

1
2

Antony Schutz

Fonction : Auteur
PersonId : 895446

Eurecom [Sophia Antipolis]

Laboratoire Traitement et Communication de l'Information

Résumé

For humans, the sound is valuable mostly for its meaning. The voice is spoken language, music, artistic intent. Its physiological functioning is highly developed, as well as our understanding of the underlying process. It is a challenge to replicate this analysis using a computer: in many aspects, its capabilities do not match those of human beings when it comes to speech or instruments music recognition from the sound, to name a few. The problem of sources separation arises when several audio sources are present at the same moment, mixed together and acquired by some sensors (one in our case). In this kind of situation it is natural for a human to separate and to recognize several speakers. This problem, known as the Cocktail Problem, receives a lot of attention but is still open. Since we work with only one observation, no spatial informations can be used and a modelization of the sources is needed. The second part deals with Musical Processing and is composed of several annexe. The task that we investigate is connected to the Automatic Music Transcription task, which is the process of understanding the content of a song in order to generate a music score. But, music cannot be reduced to a succession of notes, and an accurate transcriptor should be able to detect other performance characteristics such as interpretations effects.

Pour les êtres humains, le son n'a d'importance que pour son contenu. La voie est un langage parlé, la musique une intention artistique. Le processus physiologique est hautement développé, tout comme notre capacité à comprendre les processus sous-jacent. C'est un défi de faire exécuter la même tâche à un ordinateur: ses capacités n'égalent pas celles des humains lorsqu'il s'agit de comprendre le contenu d'un son composé de paroles et/ou d'instruments de musique. Dans la première partie nos recherches portent sur la séparation aveugle de source en n'utilisant qu'un seul microphone. Le problème de séparation de source audio apparaît dès que plusieurs sources audio sont présentes au même moment, mélangées puis acquises par des capteurs, un unique microphone dans notre cas. Dans ce genre de situation il est naturel pour un être humain de séparer et de reconnaître plusieurs locuteurs. Ce problème, connu sous le nom de Cocktail Problem à reçu beaucoup d'attention mais est toujours ouvert. Comme nous ne travaillons qu'avec une seule observation nous ne pouvons pas utiliser d'indice lié à la spatialisation et nous sommes dans l'obligation de modéliser les sources. La deuxième partie traite du traitement musical et est composée de plusieurs annexes. La tâche analysée est liée au traitement automatique de la musique, qui a pour but de comprendre un contenu musical afin d'en générer la partition. Cependant la musique ne peut pas être réduite à une succession de notes et un bon transcripteur devrait être capable de détecter les effets d'interprétations et la qualité de jeu du musicien.

Mots clés

source séparation adaptive analysis spectral analysis AR modelization

Séparation de source traitement adaptatif analyse spectral modélisation AR Ornementation

Domaines

Traitement du signal et de l'image [eess.SP] Traitement du signal et de l'image [eess.SP]

Fichier principal

thesis_Schutz.pdf (20.59 Mo)

Antony Schutz : Connectez-vous pour contacter le contributeur

https://pastel.hal.science/pastel-00576471

Soumis le : lundi 14 mars 2011-13:15:52

Dernière modification le : lundi 9 octobre 2023-12:49:40

Archivage à long terme le : mercredi 15 juin 2011-02:58:58

Dates et versions

pastel-00576471 , version 1 (14-03-2011)

Identifiants

HAL Id : pastel-00576471 , version 1

Citer

Antony Schutz. Quelques Contributions au Traitement de Signal Musical et à la Séparation Aveugle de Source Audio Mono-Microphone. Traitement du signal et de l'image [eess.SP]. Télécom ParisTech, 2010. Français. ⟨NNT : ⟩. ⟨pastel-00576471⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

INSTITUT-TELECOM PASTEL CNRS EURECOM PARISTECH LTCI AFIM

473 Consultations

1078 Téléchargements

Some Contributions to Music Signal Processing and to Mono-Microphone Blind Audio Source Separation

Quelques Contributions au Traitement de Signal Musical et à la Séparation Aveugle de Source Audio Mono-Microphone

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager