Non-negative matrix factorizations. Constrained and probabilistic approaches and application to automatic transcription of polyphonic music. - Archive ouverte HAL Access content directly
Theses Year : 2009

Non-negative matrix factorizations. Constrained and probabilistic approaches and application to automatic transcription of polyphonic music.

Les factorisations en matrices non-négatives. Approches contraintes et probabilistes, application à la transcription automatique de musique polyphonique.

(1)
1
Nancy Bertin

Abstract

Automatic transcription of music consists in producing a symbolic representation of a piece of music (for instance a MIDI file) from the raw audio content. Monodic music transcription is now well handled, but the case of polyphonic music is still a widely open question. Eigenvalue decomposition and singular value decomposition are classical linear algebra techniques, used in a wide range of signal processing applications. They allow to represent efficiciently the observed data by using a limited number of elementary atoms. Unlike other signal representation techniques, those atoms are not searched among a pre-defined dictionary, but learnt from the data itself. Non-negative matrix factorization (NMF) is a similar technique from linear algebra, which reduces the rank while providing atoms with exclusively positive entries, more easy to interpret. It provides simultaneously a dictionary extracted from the data, and the decomposition of the same data on this dictionary. This thesis is devoted to a detailed theoretical and experimental study of this method. It aims at several goals: improving the performance of NMF-based music transcription systems, enhancing the semantics of the produced mid-level representations, and controlling theoretical and practical properties of both state-of-the-art and original algorithms which were implemented during the thesis.
La transcription automatique de la musique est l'opération qui consiste, partant du seul contenu audio, à produire une représentation symbolique (par exemple un fichier MIDI) d'un morceau de musique. Si la transcription de musique monodique est aujourd'hui bien maîtrisée, le cas de la musique polyphonique est en revanche un problème largement ouvert. Les décompositions de matrices en valeurs propres et en valeurs singulières sont des techniques classiques d'algèbre linéaire utilisées dans un grand nombre d'applications de traitement du signal. Elles permettent de représenter efficacement les données observées en utilisant un nombre limité d'atomes élémentaires. Contrairement à d'autres techniques de représentations du signal, ces atomes ne sont pas recherchés au sein d'un dictionnaire pré-défini, mais sont extraits des données elles-mêmes. La factorisation en matrices non-négatives (NMF) est une technique analogue d'algèbre linéaire, qui réduit le rang tout en fournissant des atomes à valeurs exclusivement positives, plus facilement interprétables. Elle fournit conjointement un dictionnaire extrait des données et la décomposition de ces mêmes données dans ce dictionnaire. Ce mémoire est consacré à l'étude théorique et expérimentale détaillée de ces méthodes. Il poursuit plusieurs objectifs : l'amélioration des performances des systèmes de transcription qui les utilisent, de la pertinence sémantique des représentations mi-niveau produites, et du contrôle des propriétés théoriques et pratiques des algorithmes existants et originaux mis en œuvre au cours de la thèse.
Fichier principal
Vignette du fichier
these.pdf (3.39 Mo) Télécharger le fichier
Loading...

Dates and versions

tel-00472896 , version 1 (13-04-2010)

Identifiers

  • HAL Id : tel-00472896 , version 1

Cite

Nancy Bertin. Les factorisations en matrices non-négatives. Approches contraintes et probabilistes, application à la transcription automatique de musique polyphonique.. Traitement du signal et de l'image [eess.SP]. Télécom ParisTech, 2009. Français. ⟨NNT : ⟩. ⟨tel-00472896⟩
754 View
2757 Download

Share

Gmail Facebook Twitter LinkedIn More