Neural Learning Methods for Human-Computer Interaction

Résumé : Cette thèse a pour but d'améliorer la tâche de reconnaître des gestes de main en utilisant des techniques d'apprentissage par ordinateur et de traitement du signal. Les principales contributions de la thèse sont dédiés à la théorie de l'apprentissage par ordinateur et à l'interaction homme-machine. L'objectif étant d'implanter toutes méthodes en temps réel, toute méthode employé au cours de cette thèse était un compromis entre puissance et temps de calcul nécessaire.Plusieurs pistes ont été poursuivi : au début, la fusion des informations fournies par plusieurs capteurs tu type « time-of-flight » a été étudiée, dans le but d'améliorer le taux de reconnaissances correctes par rapport au cas avec un seul capteur. En particulier, l'impact des différentes caractéristiques calculés à partir d'une nuage de points, et de ses paramètres, a été évalué. Egalement, la performance des réseaux multi-couches (MLP) à été comparé avec celle d'un séparateur à vaste marge (SVM).En s'appuyant sur ces résultats, l'implantation du système dans une voiture a eté effectuée. Tout d'abord, nous avons montré que le système n'est pas du tout gêné par le fait d'être exposé aux conditions d'éclairage « outdoor ». L'extension de la base d'entraînement et une modification des caractéristiques calculé de la nuage des points a pu augmenter le taux de bonnes reconnaissances de façon très significative, ainsi que le rajout des mesures de confiance à la classification.Afin d'améliorer la performance des classifieurs à la base des réseaux multi-couche (MLP), une nouvelle méthode assez simple a été mise au point ensuite. Cette méthode met au profit des informations déjà présentes dans la dernière couche du réseau. En combinant cette nouvelle approche avec une technique de fusion, le taux de bonnes reconnaissances est amélioré, et surtout pour le cas des échantillons « difficiles ». Ces résultats ont été analysés et comparés de façon approfondie en comparant des différentes possibilités de fusion dans un tel contexte. L'exploitation du fait que les données traitées dont des séquences, et qu'il y a par conséquent une cohérence temporelle dans des échantillons successifs, a également été abordée un utilisant les mêmes techniques de fusion. Un système de « infotainment » implanté sur un smartphone, qui utilise les techniques décrites ici, a également été réalisé.Dans un dernier temps, un modèle simplifié de la reconnaissance des gestes dynamiques a été proposé et validé dans un contexte applicatif. Il a été montré que un geste peut être défini de façon assez robuste par une pose initiale et une pose finale, qui sont classé par le système décrit ci-dessus.
Type de document :
Thèse
Machine Learning [cs.LG]. Université Paris-Saclay, 2016. English. 〈NNT : 2016SACLY002〉
Liste complète des métadonnées

Littérature citée [132 références]  Voir  Masquer  Télécharger

https://pastel.archives-ouvertes.fr/tel-01356324
Contributeur : Abes Star <>
Soumis le : jeudi 25 août 2016 - 14:48:08
Dernière modification le : vendredi 1 décembre 2017 - 01:20:25
Document(s) archivé(s) le : samedi 26 novembre 2016 - 16:23:34

Fichier

53919_KOPINSKI_2016_archivage....
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01356324, version 1

Citation

Thomas Kopinski. Neural Learning Methods for Human-Computer Interaction. Machine Learning [cs.LG]. Université Paris-Saclay, 2016. English. 〈NNT : 2016SACLY002〉. 〈tel-01356324〉

Partager

Métriques

Consultations de la notice

1939

Téléchargements de fichiers

309