Classification automatique des signaux audio-fréquences : reconnaissance des instruments de musique - PASTEL - Thèses en ligne de ParisTech Accéder directement au contenu
Thèse Année : 2005

Automatic Classification of Audio Signals: Machine Recognition of Musical Instruments

Classification automatique des signaux audio-fréquences : reconnaissance des instruments de musique

Résumé

The aim of this work is to contribute efficient solutions to machine recognition of musical instruments both for the mono-instrumental and multi-instrumental cases. We tackle the problem following an automatic classification approach. Much effort is dedicated to obtain adequate instances of the different blocs constituting the system which we propose for instrument recognition. We adopt a hierarchical classification scheme based on computer-generated taxonomies of instruments and musical ensembles. The system utilises a novel feature selection technique producing an efficient description of audio signals which, in association with support vector machines, entails high recognition accuracy on sound excerpts translating the diversity of the musical performance and recording conditions found in the real world. Our proposal is thus able to recognise up to four instruments played concurrently in jazz music possibly involving percussion.
L'objet de cette thèse est de contribuer à améliorer l'identification automatique des instruments de musique dans des contextes réalistes, (sur des solos de musique, mais également sur des pièces multi-instrumentales). Nous abordons le problème suivant une approche de classification automatique en nous efforçant de rechercher des réalisations performantes des différents modules constituant le système que nous proposons. Nous adoptons un schéma de classification hiérarchique basé sur des taxonomies des instruments et des mélanges d'instruments. Ces taxonomies sont inférées au moyen d'un algorithme de clustering hiérarchique exploitant des distances probabilistes robustes qui sont calculées en utilisant une méthode à noyau. Le système exploite un nouvel algorithme de sélection automatique des attributs pour produire une description efficace des signaux audio qui, associée à des machines à vecteurs supports, permet d'atteindre des taux de reconnaissance élevés sur des pièces sonores reflétant la diversité de la pratique musicale et des conditions d'enregistrement rencontrées dans le monde réel. Notre architecture parvient ainsi à identifier jusqu'à quatre instruments joués simultanément, à partir d'extraits de jazz incluant des percussions.
Fichier principal
Vignette du fichier
these_essid.pdf (2.01 Mo) Télécharger le fichier
Loading...

Dates et versions

pastel-00002738 , version 1 (19-11-2010)

Identifiants

  • HAL Id : pastel-00002738 , version 1

Citer

Slim Essid. Classification automatique des signaux audio-fréquences : reconnaissance des instruments de musique. Traitement du signal et de l'image [eess.SP]. Université Pierre et Marie Curie - Paris VI, 2005. Français. ⟨NNT : ⟩. ⟨pastel-00002738⟩
1276 Consultations
7039 Téléchargements

Partager

Gmail Facebook X LinkedIn More