Learning from multiple genomic information in cancer for diagnosis and prognosis

Résumé : De nombreuses initiatives ont été mises en places pour caractériser d'un point de vue moléculaire de grandes cohortes de cancers à partir de diverses sources biologiques dans l'espoir de comprendre les altérations majeures impliquées durant la tumorogénèse. Les données mesurées incluent l'expression des gènes, les mutations et variations de copy-number, ainsi que des signaux épigénétiques tel que la méthylation de l'ADN. De grands consortium tels que “The Cancer Genome Atlas” (TCGA) ont déjà permis de rassembler plusieurs milliers d'échantillons cancéreux mis à la disposition du public. Nous contribuons dans cette thèse à analyser d'un point de vue mathématique les relations existant entre les différentes sources biologiques, valider et/ou généraliser des phénomènes biologiques à grande échelle par une analyse intégrative de données épigénétiques et génétiques.En effet, nous avons montré dans un premier temps que la méthylation de l'ADN était un marqueur substitutif intéressant pour jauger du caractère clonal entre deux cellules et permettait ainsi de mettre en place un outil clinique des récurrences de cancer du sein plus précis et plus stable que les outils actuels, afin de permettre une meilleure prise en charge des patients.D'autre part, nous avons dans un second temps permis de quantifier d'un point de vue statistique l'impact de la méthylation sur la transcription. Nous montrons l'importance d'incorporer des hypothèses biologiques afin de pallier au faible nombre d'échantillons par rapport aux nombre de variables.Enfin, nous montrons l'existence d'un phénomène biologique lié à l'apparition d'un phénotype d'hyperméthylation dans plusieurs cancers. Pour cela, nous adaptons des méthodes de régression en utilisant la similarité entre les différentes tâches de prédictions afin d'obtenir des signatures génétiques communes prédictives du phénotypes plus précises.En conclusion, nous montrons l'importance d'une collaboration biologique et statistique afin d'établir des méthodes adaptées aux problématiques actuelles en bioinformatique.
Type de document :
Thèse
Quantitative Methods [q-bio.QM]. Ecole Nationale Supérieure des Mines de Paris, 2015. English. 〈NNT : 2015ENMP0086〉
Liste complète des métadonnées

https://pastel.archives-ouvertes.fr/tel-01449202
Contributeur : Abes Star <>
Soumis le : lundi 30 janvier 2017 - 11:06:07
Dernière modification le : mardi 16 janvier 2018 - 03:53:31

Fichier

2015ENMP0086_archivage.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01449202, version 1

Collections

Citation

Matahi Moarii. Learning from multiple genomic information in cancer for diagnosis and prognosis. Quantitative Methods [q-bio.QM]. Ecole Nationale Supérieure des Mines de Paris, 2015. English. 〈NNT : 2015ENMP0086〉. 〈tel-01449202〉

Partager

Métriques

Consultations de la notice

349

Téléchargements de fichiers

106