Skip to Main content Skip to Navigation
Theses

Unified data-driven approach for audio indexing, retrieval and recognition

Résumé : La quantité de données audio disponibles, telles que les enregistrements radio, la musique, les podcasts et les publicités est en augmentation constance. Par contre, il n'y a pas beaucoup d'outils de classification et d'indexation, qui permettent aux utilisateurs de naviguer et retrouver des documents audio. Dans ces systèmes, les données audio sont traitées différemment en fonction des applications. La diversité de ces techniques d'indexation rend inadéquat le traitement simultané de flux audio où différents types de contenu audio coexistent. Dans cette thèse, nous présentons nos travaux sur l'extension de l'approche ALISP, développé initialement pour la parole, comme une méthode générique pour l'indexation et l'identification audio. La particularité des outils ALISP est qu'aucune transcription textuelle ou annotation manuelle est nécessaire lors de l'étape d'apprentissage. Le principe de cet outil est de transformer les données audio en une séquence de symboles. Ces symboles peuvent être utilisés à des fins d'indexation. La principale contribution de cette thèse est l'exploitation de l'approche ALISP comme une méthode générique pour l'indexation audio. Ce système est composé de trois modules: acquisition et modélisation des unités ALISP d'une manière non supervisée, transcription ALISP des données audio et comparaison des symboles ALISP avec la technique BLAST et la distance de Levenshtein. Les évaluations du système proposé pour les différentes applications sont effectuées avec la base de données YACAST et avec d'autres corpus disponibles publiquement pour différentes tâche de l'indexation audio.
Complete list of metadatas

Cited literature [143 references]  Display  Hide  Download

https://pastel.archives-ouvertes.fr/tel-01179994
Contributor : Abes Star :  Contact
Submitted on : Thursday, July 23, 2015 - 4:58:05 PM
Last modification on : Friday, July 31, 2020 - 10:44:05 AM
Document(s) archivé(s) le : Wednesday, April 26, 2017 - 8:03:54 AM

File

ThesekhemiriV2.pdf
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-01179994, version 1

Citation

Houssemeddine Khemiri. Unified data-driven approach for audio indexing, retrieval and recognition. Signal and Image processing. Télécom ParisTech, 2013. English. ⟨NNT : 2013ENST0055⟩. ⟨tel-01179994⟩

Share

Metrics

Record views

317

Files downloads

379