Skip to Main content Skip to Navigation
Theses

Learning new representations for 3D point cloud semantic segmentation

Résumé : Aujourd’hui, de nouvelles technologies permettent l’acquisition de scènes 3D volumineuses et précises sous la forme de nuages de points. Les nouvelles applications ouvertes par ces technologies, comme les véhicules autonomes ou la maintenance d'infrastructure, reposent sur un traitement efficace des nuages de points à grande échelle. Les méthodes d'apprentissage profond par convolution ne peuvent pas être utilisées directement avec des nuages de points. Dans le cas des images, les filtres convolutifs ont permis l’apprentissage de nouvelles représentations, jusqu’alors construites « à la main » dans les méthodes de vision par ordinateur plus anciennes. En suivant le même raisonnement, nous présentons dans cette thèse une étude des représentations construites « à la main » utilisées pour le traitement des nuages de points. Nous proposons ainsi plusieurs contributions, qui serviront de base à la conception d’une nouvelle représentation convolutive pour le traitement des nuages de points. Parmi elles, une nouvelle définition de voisinages sphériques multi-échelles, une comparaison avec les k plus proches voisins multi-échelles, une nouvelle stratégie d'apprentissage actif, la segmentation sémantique des nuages de points à grande échelle, et une étude de l'influence de la densité dans les représentations multi-échelles. En se basant sur ces contributions, nous introduisons la « Kernel Point Convolution » (KPConv), qui utilise des voisinages sphériques et un noyau défini par des points. Ces points jouent le même rôle que les pixels du noyau des convolutions en image. Nos réseaux convolutionnels surpassent les approches de segmentation sémantique de l’état de l’art dans presque toutes les situations. En plus de ces résultats probants, nous avons conçu KPConv avec une grande flexibilité et une version déformable. Pour conclure notre réflexion, nous proposons plusieurs éclairages sur les représentations que notre méthode est capable d'apprendre.
Document type :
Theses
Complete list of metadatas

https://pastel.archives-ouvertes.fr/tel-02458455
Contributor : Abes Star :  Contact
Submitted on : Tuesday, January 28, 2020 - 5:06:10 PM
Last modification on : Thursday, April 9, 2020 - 5:08:13 PM
Document(s) archivé(s) le : Wednesday, April 29, 2020 - 4:44:03 PM

File

2019PSLEM048_archivage.pdf
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-02458455, version 1

Citation

Hugues Thomas. Learning new representations for 3D point cloud semantic segmentation. Machine Learning [cs.LG]. PSL Research University, 2019. English. ⟨NNT : 2019PSLEM048⟩. ⟨tel-02458455⟩

Share

Metrics

Record views

244

Files downloads

359