Skip to Main content Skip to Navigation
Theses

Contributions to variable selection, clustering and statistical estimation inhigh dimension

Résumé : Cette thèse traite les problèmes statistiques suivants : la sélection de variables dans le modèle de régression linéaire en grande dimension, le clustering dans le modèle de mélange Gaussien, quelques effets de l'adaptabilité sous l'hypothèse de parcimonie ainsi que la simulation des processus Gaussiens.Sous l'hypothèse de parcimonie, la sélection de variables correspond au recouvrement du "petit" ensemble de variables significatives. Nous étudions les propriétés non-asymptotiques de ce problème dans la régression linéaire en grande dimension. De plus, nous caractérisons les conditions optimales nécessaires et suffisantes pour la sélection de variables dans ce modèle. Nous étudions également certains effets de l'adaptation sous la même hypothèse. Dans le modèle à vecteur parcimonieux, nous analysons les changements dans les taux d'estimation de certains des paramètres du modèle lorsque le niveau de bruit ou sa loi nominale sont inconnus.Le clustering est une tâche d'apprentissage statistique non supervisée visant à regrouper des observations proches les unes des autres dans un certain sens. Nous étudions le problème de la détection de communautés dans le modèle de mélange Gaussien à deux composantes, et caractérisons précisément la séparation optimale entre les groupes afin de les recouvrir de façon exacte. Nous fournissons également une procédure en temps polynomial permettant un recouvrement optimal des communautés.Les processus Gaussiens sont extrêmement utiles dans la pratique, par exemple lorsqu'il s'agit de modéliser les fluctuations de prix. Néanmoins, leur simulation n'est pas facile en général. Nous proposons et étudions un nouveau développement en série à taux optimal pour simuler une grande classe de processus Gaussiens.
Document type :
Theses
Complete list of metadatas

Cited literature [171 references]  Display  Hide  Download

https://pastel.archives-ouvertes.fr/tel-02266365
Contributor : Abes Star :  Contact
Submitted on : Wednesday, August 14, 2019 - 9:03:06 AM
Last modification on : Monday, February 3, 2020 - 1:28:05 AM
Document(s) archivé(s) le : Thursday, January 9, 2020 - 11:33:54 PM

File

80528_NDAOUD_2019_archivage.pd...
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-02266365, version 1

Citation

Mohamed Ndaoud. Contributions to variable selection, clustering and statistical estimation inhigh dimension. Statistics [math.ST]. Université Paris-Saclay, 2019. English. ⟨NNT : 2019SACLG005⟩. ⟨tel-02266365⟩

Share

Metrics

Record views

545

Files downloads

439