Discovering patterns in high-dimensional extremes

Maël Chiapino

Thèse Année : 2018

Discovering patterns in high-dimensional extremes

Apprentissage de structures dans les valeurs extrêmes en grande dimension

(1)

Maël Chiapino

Fonction : Auteur

Laboratoire Traitement et Communication de l'Information

Résumé

We present and study unsupervised learning methods of multivariate extreme phenomena in high-dimension. Considering a random vector on which each marginal is heavy-tailed, the study of its behavior in extreme regions is no longer possible via usual methods that involve finite means and variances. Multivariate extreme value theory provides an adapted framework to this study. In particular it gives theoretical basis to dimension reduction through the angular measure. The thesis is divided in two main part: - Reduce the dimension by finding a simplified dependence structure in extreme regions. This step aim at recover subgroups of features that are likely to exceed large thresholds simultaneously. - Model the angular measure with a mixture distribution that follows a predefined dependence structure. These steps allow to develop new clustering methods for extreme points in high dimension.

Nous présentons et étudions des méthodes d’apprentissage non-supervisé de phénomènes extrêmes multivariés en grande dimension. Dans le cas où chacune des distributions marginales d’un vecteur aléatoire est à queue lourde, l’étude de son comportement dans les régions extrêmes (i.e. loin de l’origine) ne peut plus se faire via les méthodes usuelles qui supposent une moyenne et une variance finies. La théorie des valeurs extrêmes offre alors un cadre adapté à cette étude, en donnant notamment une base théorique à la réduction de dimension à travers la mesure angulaire. La thèse s’articule autour de deux grandes étapes : - Réduire la dimension du problème en trouvant un résumé de la structure de dépendance dans les régions extrêmes. Cette étape vise en particulier à trouver les sous-groupes de composantes étant susceptible de dépasser un seuil élevé de façon simultané. - Modéliser la mesure angulaire par une densité de mélange qui suit une structure de dépendance déterminée à l’avance. Ces deux étapes permettent notamment de développer des méthodes de classification non-supervisée à travers la construction d’une matrice de similarité pour les points extrêmes.

Mots clés

Extreme value theory Unsupervised learning Dimension reduction Clustering

Théorie des valeurs extrêmes Apprentissage non-supervisé Réduction de dimension Clustering

Domaines

Machine Learning [stat.ML]

Fichier principal

manuscript_final.pdf (7.16 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://pastel.hal.science/tel-02294009

Soumis le : lundi 23 septembre 2019-07:53:07

Dernière modification le : mardi 28 février 2023-15:36:24

Archivage à long terme le : dimanche 9 février 2020-02:38:05

Dates et versions

tel-02294009 , version 1 (23-09-2019)

Identifiants

HAL Id : tel-02294009 , version 1

Citer

Maël Chiapino. Discovering patterns in high-dimensional extremes. Machine Learning [stat.ML]. Télécom ParisTech, 2018. English. ⟨NNT : 2018ENST0035⟩. ⟨tel-02294009⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

INSTITUT-TELECOM PASTEL STAR PARISTECH LTCI

175 Consultations

164 Téléchargements

Discovering patterns in high-dimensional extremes

Apprentissage de structures dans les valeurs extrêmes en grande dimension

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager