Skip to Main content Skip to Navigation
Theses

Deep learning for semantic description of visual human traits

Résumé : Les progrès récents des réseaux de neurones artificiels (plus connus sous le nom d'apprentissage profond) ont permis d'améliorer l’état de l’art dans plusieurs domaines de la vision par ordinateur. Dans cette thèse, nous étudions des techniques d'apprentissage profond dans le cadre de l’analyse du genre et de l’âge à partir du visage humain. En particulier, deux problèmes complémentaires sont considérés : (1) la prédiction du genre et de l’âge, et (2) la synthèse et l’édition du genre et de l’âge.D’abord, nous effectuons une étude détaillée qui permet d’établir une liste de principes pour la conception et l’apprentissage des réseaux de neurones convolutifs (CNNs) pour la classification du genre et l’estimation de l’âge. Ainsi, nous obtenons les CNNs les plus performants de l’état de l’art. De plus, ces modèles nous ont permis de remporter une compétition internationale sur l’estimation de l’âge apparent. Nos meilleurs CNNs obtiennent une précision moyenne de 98.7% pour la classification du genre et une erreur moyenne de 4.26 ans pour l’estimation de l’âge sur un corpus interne particulièrement difficile.Ensuite, afin d’adresser le problème de la synthèse et de l’édition d’images de visages, nous concevons un modèle nommé GA-cGAN : le premier réseau de neurones génératif adversaire (GAN) qui produit des visages synthétiques réalistes avec le genre et l’âge souhaités. Enfin, nous proposons une nouvelle méthode permettant d’employer GA-cGAN pour le changement du genre et de l’âge tout en préservant l’identité dans les images synthétiques. Cette méthode permet d'améliorer la précision d’un logiciel sur étagère de vérification faciale en présence d’écarts d’âges importants.
Complete list of metadatas

Cited literature [266 references]  Display  Hide  Download

https://pastel.archives-ouvertes.fr/tel-01725853
Contributor : Abes Star :  Contact
Submitted on : Wednesday, March 7, 2018 - 4:35:08 PM
Last modification on : Saturday, December 21, 2019 - 4:47:13 AM
Document(s) archivé(s) le : Friday, June 8, 2018 - 2:53:08 PM

File

Antipov_PhD_Manuscript_2017-12...
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-01725853, version 1

Collections

Citation

Grigory Antipov. Deep learning for semantic description of visual human traits. Neural and Evolutionary Computing [cs.NE]. Télécom ParisTech, 2017. English. ⟨NNT : 2017ENST0071⟩. ⟨tel-01725853⟩

Share

Metrics

Record views

1548

Files downloads

1899