Deep learning for multivariate time series : from vehicle control to gesture recognition and generation

Guillaume Devineau

Thèse Année : 2020

Deep learning for multivariate time series : from vehicle control to gesture recognition and generation

Apprentissage profond pour les séries temporelles multivariées : contrôle de véhicule autonome, reconnaissance de gestes et génération de mouvement

(1)

Guillaume Devineau

Fonction : Auteur

Centre de Robotique

Résumé

Artificial intelligence is the scientific field which studies how to create machines that are capable of intelligent behaviour. Deep learning is a family of artificial intelligence methods based on neural networks. In recent years, deep learning has lead to groundbreaking developments in the image and natural language processing fields. However, in many domains, input data consists in neither images nor text documents, but in time series that describe the temporal evolution of observed or computed quantities. In this thesis, we study and introduce different representations for time series, based on deep learning models. Firstly, in the autonomous driving domain, we show that, the analysis of a temporal window by a neural network can lead to better vehicle control results than classical approaches that do not use neural networks, especially in highly-coupled situations. Secondly, in the gesture and action recognition domain, we introduce 1D parallel convolutional neural network models. In these models, convolutions are performed over the temporal dimension, in order for the neural network to detect -and benefit from- temporal invariances. Thirdly, in the human pose motion generation domain, we introduce 2D convolutional generative adversarial neural networks where the spatial and temporal dimensions are convolved in a joint manner. Finally, we introduce an embedding where spatial representations of human poses are sorted in a latent space based on their temporal relationships.

L'apprentissage profond est une branche du domaine de l'intelligence artificielle qui vise à doter les machines de la capacité d'apprendre par elles-mêmes à réaliser des tâches précises. L'apprentissage profond a abouti à des développements spectaculaires dans le domaine de l'image et du langage naturel au cours des dernières années. Pourtant, dans de nombreux domaines, les données d'observations ne sont ni des images ni du texte mais des séries temporelles qui représentent l'évolution de grandeurs mesurées ou calculées. Dans cette thèse, nous étudions et proposons différentes représentations de séries temporelles à partir de modèles d'apprentissage profond. Dans un premier temps, dans le domaine du contrôle de véhicules autonomes, nous montrons que l'analyse d'une fenêtre temporelle par un réseau de neurones permet d'obtenir de meilleurs résultats que les méthodes classiques qui n'utilisent pas de réseaux de neurones. Dans un second temps, en reconnaissance de gestes et d'actions, nous proposons des réseaux de neurones convolutifs 1D où la dimension temporelle seule est convoluée, afin de tirer profit des invariances temporelles. Dans un troisième temps, dans un but de génération de mouvements humains, nous proposons des réseaux de neurones génératifs convolutifs 2D où les dimensions temporelles et spatiales sont convoluées de manière jointe. Enfin, dans un dernier temps, nous proposons un plongement où des représentations spatiales de poses humaines sont (ré)organisées dans un espace latent en fonction de leurs relations temporelles.

Mots clés

Deep learning Coupled vehicle control Gesture and action recognition Human motion generation Human pose embedding Time series Sequence modeling

Apprentissage profond Contrôle couplé de véhicule Reconnaissance de gestes et d’actions Génération de mouvements humains Représentation de pose humaine Séries temporelles Modélisation de données séquentielles

Domaines

Apprentissage [cs.LG]

Fichier principal

2020UPSLM037_archivage.pdf (75.16 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://pastel.hal.science/tel-03097368

Soumis le : mardi 5 janvier 2021-12:24:44

Dernière modification le : vendredi 19 avril 2024-16:18:56

Archivage à long terme le : mercredi 7 avril 2021-09:24:48

Dates et versions

tel-03097368 , version 1 (05-01-2021)

Identifiants

HAL Id : tel-03097368 , version 1

Citer

Guillaume Devineau. Deep learning for multivariate time series : from vehicle control to gesture recognition and generation. Machine Learning [cs.LG]. Université Paris sciences et lettres, 2020. English. ⟨NNT : 2020UPSLM037⟩. ⟨tel-03097368⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

INSTITUT-TELECOM ENSMP PASTEL STAR ENSMP_CAOR PARISTECH PSL ENSMP_DR

654 Consultations

103 Téléchargements

Deep learning for multivariate time series : from vehicle control to gesture recognition and generation

Apprentissage profond pour les séries temporelles multivariées : contrôle de véhicule autonome, reconnaissance de gestes et génération de mouvement

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager