L'analyse probabiliste en composantes latentes et ses adaptations aux signaux musicaux : application à la transcription automatique de musique et à la séparation de sources

Résumé : La transcription automatique de musique polyphonique consiste à estimer automatiquernent les notes présentes dans un enregistrement via trois de leurs attributs : temps d'attaque, durée et hauteur. Pour traiter ce problème, il existe une classe de méthodes dont le principe est de modéliser un signal comme une somme d'éléments de base, porteurs d'informations symboliques. Parmi ces techniques d'analyse, on trouve l'analyse probabiliste en composantes latentes (PLCA). L'objet de cette thèse est de proposer des variantes et des améliorations de la PLCA afin qu'elle puisse mieux s'adapter aux signaux musicaux et ainsi mieux traiter le problème de la transcription. Pour cela, un premier angle d'approche est de proposer de nouveaux modèles de signaux, en lieu et place du modèle inhérent à la PLCA, suffisamment expressifs pour pouvoir s'adapter aux notes de musique possédant simultanément des variations temporelles de fréquence fondamentale et d'enveloppe spectrale. Un deuxième aspect du travail effectué est de proposer des outils permettant d'aider l'algorithme d'estimation des paramètres à converger vers des solutions significatives via l'incorporation de connaissances a priori sur les signaux à analyser, ainsi que d'un nouveau modèle dynamique. Tous les algorithmes ainsi imaginés sont appliqués à la tâche de transcription automatique. Nous voyons également qu'ils peuvent être directement utilisés pour la séparation de sources, qui consiste à séparer plusieurs sources d'un mélange, et nous proposons deux applications dans ce sens.
Type de document :
Thèse
Traitement du signal et de l'image. Télécom ParisTech, 2013. Français. 〈NNT : 2013ENST0011〉
Liste complète des métadonnées

https://pastel.archives-ouvertes.fr/tel-01337630
Contributeur : Abes Star <>
Soumis le : lundi 27 juin 2016 - 13:10:12
Dernière modification le : jeudi 11 janvier 2018 - 06:23:39
Document(s) archivé(s) le : mercredi 28 septembre 2016 - 11:12:13

Fichier

TheseFuentes.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01337630, version 1

Citation

Benoît Fuentes. L'analyse probabiliste en composantes latentes et ses adaptations aux signaux musicaux : application à la transcription automatique de musique et à la séparation de sources. Traitement du signal et de l'image. Télécom ParisTech, 2013. Français. 〈NNT : 2013ENST0011〉. 〈tel-01337630〉

Partager

Métriques

Consultations de la notice

244

Téléchargements de fichiers

167