Extraction d'information rythmique à partir d'enregistrements musicaux - PASTEL - Thèses en ligne de ParisTech Accéder directement au contenu
Thèse Année : 2006

Extraction d'information rythmique à partir d'enregistrements musicaux

Résumé

This dissertation presents work on the development of tools for the automated analysis of music signals, more exactly it proposes a number of techniques to identify and examine the fundamental elements of musical rhythm. There exist many applications requiring rhythmic information, for example automatic music transcription, music information retrieval, audio special effects, audio editing. The main research axis consisted in the development of techniques to estimate rhythmic parameters of music such as beat rates and beat localizations at two different metrical levels: the tatum and the tactus (or tempo). In this work, we have proposed to carry out the analysis after separating the audio signal in a deterministic part (containing the harmonic sounds) and the stochastic part (containing the residual signal after extracting the harmonic part from the original signal). We exploited the principle of the so-called Spectral Energy Flux, i.e., the rate of change of the power spectrum in audio signals as a function of time, to develop an effective algorithm to estimate the amount of musical stress at a given time. We have also presented a technique based on the dynamic programming algorithm which was specially conceived to track simultaneously the course of several rhythmic trajectories through time. The effectiveness of the whole system and of a number of its derivatives was validated using a database comprising 1435 musical pieces and covering ten musical genres. In addition, the developed algorithms were submitted to external evaluation within the framework of the international contest "Music Information Retrieval Evaluation eXchange (MIREX)" in the category of "tempo extraction", and in the edition of 2005 one of our algorithms obtained the first place among more than twelve submissions.
L'objectif de cette thèse est la recherche d'outils de détection et de reconnaissance de la structure rythmique d'un morceau de musique. Il existe de nombreuses applications nécessitant l'information rythmique, parmi lesquelles la transcription musicale par ordinateur, l'alignement rythmique de plusieurs instruments, tâches de "music information retrieval". L'axe principal du travail de recherche a consisté en le développement de techniques pour l'estimation des paramètres rythmiques (cadences et localisation de beats à plusieurs niveaux). Parmi les originalités de ce travail de recherche, nous avons proposé de effectuer l'analyse rythmique de façon séparée sur la partie déterministe du signal musical (contenant les sons harmoniques) et sur la partie stochastique (contenant le signal résiduel après extraire la partie harmonique du son original). Dans le domaine du traitement des signaux audio, la détection robuste et efficace des attaques (onsets) des signaux musicaux est considérée comme un sujet difficile. A ce propos, nous utilisons le concept du flux énergétique spectral comme le taux auquel l'énergie du contenu fréquentiel du signal audio change à un instant donné. Et nous nous sommes servis de ce principe pour développer un détecteur d'attaques très performant qui améliore de façon considérable la méthode de calcule traditionnelle. Une autre originalité de ce travail consiste en l'utilisation d'un algorithme de programmation dynamique modifiée pour suivre simultanément plusieurs trajectoires rythmiques à l'intérieur d'un signal musical. L'efficacité de cette approche a été validé sur une base de données comportant 1435 morceaux musicaux appartenant à une dizaine de genres. Les algorithmes développés ont été soumis à évaluation dans le cadre du concours international "Music Information Retrieval Evaluation eXchange" (MIREX) dans la catégorie de "tempo extraction" et dans la l'édition 2005 un des algorithmes obtenu la première place parmi plus d'une dizaine de participants.

Domaines

Fichier principal
Vignette du fichier
these.pdf (3.29 Mo) Télécharger le fichier
Loading...

Dates et versions

pastel-00002244 , version 1 (04-05-2007)

Identifiants

  • HAL Id : pastel-00002244 , version 1

Citer

Miguel A. Alonso Arevalo. Extraction d'information rythmique à partir d'enregistrements musicaux. domain_other. Télécom ParisTech, 2006. English. ⟨NNT : ⟩. ⟨pastel-00002244⟩
415 Consultations
922 Téléchargements

Partager

Gmail Facebook X LinkedIn More