Some Contributions to Music Signal Processing and to Mono-Microphone Blind Audio Source Separation - Archive ouverte HAL Access content directly
Theses Year : 2010

Some Contributions to Music Signal Processing and to Mono-Microphone Blind Audio Source Separation

Quelques Contributions au Traitement de Signal Musical et à la Séparation Aveugle de Source Audio Mono-Microphone

(1, 2)
1
2

Abstract

For humans, the sound is valuable mostly for its meaning. The voice is spoken language, music, artistic intent. Its physiological functioning is highly developed, as well as our understanding of the underlying process. It is a challenge to replicate this analysis using a computer: in many aspects, its capabilities do not match those of human beings when it comes to speech or instruments music recognition from the sound, to name a few. The problem of sources separation arises when several audio sources are present at the same moment, mixed together and acquired by some sensors (one in our case). In this kind of situation it is natural for a human to separate and to recognize several speakers. This problem, known as the Cocktail Problem, receives a lot of attention but is still open. Since we work with only one observation, no spatial informations can be used and a modelization of the sources is needed. The second part deals with Musical Processing and is composed of several annexe. The task that we investigate is connected to the Automatic Music Transcription task, which is the process of understanding the content of a song in order to generate a music score. But, music cannot be reduced to a succession of notes, and an accurate transcriptor should be able to detect other performance characteristics such as interpretations effects.
Pour les êtres humains, le son n'a d'importance que pour son contenu. La voie est un langage parlé, la musique une intention artistique. Le processus physiologique est hautement développé, tout comme notre capacité à comprendre les processus sous-jacent. C'est un défi de faire exécuter la même tâche à un ordinateur: ses capacités n'égalent pas celles des humains lorsqu'il s'agit de comprendre le contenu d'un son composé de paroles et/ou d'instruments de musique. Dans la première partie nos recherches portent sur la séparation aveugle de source en n'utilisant qu'un seul microphone. Le problème de séparation de source audio apparaît dès que plusieurs sources audio sont présentes au même moment, mélangées puis acquises par des capteurs, un unique microphone dans notre cas. Dans ce genre de situation il est naturel pour un être humain de séparer et de reconnaître plusieurs locuteurs. Ce problème, connu sous le nom de Cocktail Problem à reçu beaucoup d'attention mais est toujours ouvert. Comme nous ne travaillons qu'avec une seule observation nous ne pouvons pas utiliser d'indice lié à la spatialisation et nous sommes dans l'obligation de modéliser les sources. La deuxième partie traite du traitement musical et est composée de plusieurs annexes. La tâche analysée est liée au traitement automatique de la musique, qui a pour but de comprendre un contenu musical afin d'en générer la partition. Cependant la musique ne peut pas être réduite à une succession de notes et un bon transcripteur devrait être capable de détecter les effets d'interprétations et la qualité de jeu du musicien.
Fichier principal
Vignette du fichier
thesis_Schutz.pdf (20.59 Mo) Télécharger le fichier

Dates and versions

pastel-00576471 , version 1 (14-03-2011)

Identifiers

  • HAL Id : pastel-00576471 , version 1

Cite

Antony Schutz. Quelques Contributions au Traitement de Signal Musical et à la Séparation Aveugle de Source Audio Mono-Microphone. Traitement du signal et de l'image [eess.SP]. Télécom ParisTech, 2010. Français. ⟨NNT : ⟩. ⟨pastel-00576471⟩
446 View
1023 Download

Share

Gmail Facebook Twitter LinkedIn More