An open-source framework for supporting the design and implementation of natural-language spoken dialog systems

Résumé : L'interaction vocale avec des systèmes automatiques connaît, depuis quelques années, un accroissement dans l'intérêt que lui porte tant le grand public que la communauté de la recherche. Cette thèse s'inscrit dans ce cadre pour aborder le sujet depuis deux points de vue complémentaires. D'une part, celui apparent de la fiabilité, de l'efficacité et de l'utilisabilité de ces interfaces. D'autre part, les aspects de conception et d'implémentation sont étudiés pour apporter des outils de développement aux concepteurs plus ou moins initiés de tels systèmes. A partir des outils et des évolutions dans le domaine, une plate-forme modulaire de dialogue vocal a été agrégée. L'interaction continue, basée sur une "écoute" permanente du système pose des problèmes de segmentation, de débruitage, de capture de son, de sélection des segments adressés au système, etc... Une méthode simple, basée sur la comparaison des résultats de traitements parallèles a prouvé son efficacité, tout comme ses limites pour une interaction continue avec l'utilisateur. Les modules de compréhension du langage forment un sous-système interconnecté au sein de la plate-forme. Ils sont les adaptations d'algorithmes de l'état de l'art comme des idées originales. Le choix de la gestion du dialogue basé sur des modèles de tâches hiérarchiques, comme c'est la cas pour la plate-forme, est argumenté. Ce formalisme est basé sur une construction humaine et présente, de fait, des obstacles pour concevoir, implémenter, maintenir et faire évoluer les modèles. Pour parer à ceux-ci, un nouveau formalisme est proposé qui se transforme en hiérarchie de tâches grâce aux outils associés.
Liste complète des métadonnées

Littérature citée [280 références]  Voir  Masquer  Télécharger

https://pastel.archives-ouvertes.fr/tel-01420626
Contributeur : Abes Star <>
Soumis le : mardi 20 décembre 2016 - 18:06:06
Dernière modification le : jeudi 11 janvier 2018 - 06:23:39
Document(s) archivé(s) le : mardi 21 mars 2017 - 14:35:51

Fichier

theseMilhoratV2.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01420626, version 1

Citation

Pierrick Milhorat. An open-source framework for supporting the design and implementation of natural-language spoken dialog systems. Artificial Intelligence [cs.AI]. Télécom ParisTech, 2014. English. 〈NNT : 2014ENST0087〉. 〈tel-01420626〉

Partager

Métriques

Consultations de la notice

1186

Téléchargements de fichiers

258