Statistical and algorithmic developments for the analysis of Triple Negative Breast Cancers - Archive ouverte HAL Access content directly
Theses Year : 2010

Statistical and algorithmic developments for the analysis of Triple Negative Breast Cancers

Développements statistiques et algorithmiques pour l'analyse des cancers du sein de type triple négatif

(1)
1
Guillem Rigaill
  • Function : Author
  • PersonId : 901268

Abstract

Throughout the world and among the different types of cancer, breast cancer is one of the most prevalent ones. It can be subdivided in several types among which the triple negative invasive ductal breast carcinoma (TNBC). TNBC is one of the most aggressive types of breast cancer: it is associated to a poor prognosis and there is still no targeted therapy for this type of tumor. In this context, we aim to discover deregulated genes and signaling pathways in human TNBC using high-throughput omic data of well-characterized breast tumors to identify potential therapeutic targets. My work can be divided in two main parts. First, I developed methods for the analysis of genomic data: I proposed a method (ITALICS) for the normalization of Affymetrix SNP 100K and 500K arrays, worked on the segmentation of DNA copy number profiles, proposed new algorithms and new statistical tools to assess the stability of segmentation and derive exact formulation of several model selection criteria and proposed an improved and faster dynamic programming algorithm that recovers the best segmentation exactly with respect to the quadratic loss. Next, I worked on the analysis of the omic data. The first step of my analysis was to plan the experimental design of the omic experiments. I then analyzed the transcriptomic data using already developed and available tools. I sought to better characterize the distinctness of TNBC at the tran- scriptomic level and its overlap with immunohistochemistry data. I worked at the gene and pathway level to identify genes and pathways of interest. Finally, I analyzed the genomic data using the tools and methods that I have developed.
Dans le monde, le cancer du sein est le cancer le plus fréquent de la femme. Plusieurs types de cancer du sein ont été mis en évidence. Les carcinomes infiltrants triple négatif (TNBC) sont l'un de ces types. Les TNBC sont parmi les plus agressifs cancers du sein et sont associés à un mauvais pronostique. Il n'y a pas encore de traitement dédié pour ces cancers. Cette thèse avait pour but d'identifier des gènes et des voies de signalisation dérégulés dans les cancers de types TNBC en s'appuyant sur les profiles transcriptomiques et génomiques de tumeurs TNBC bien caractérisées, obtenues par la technique des biopuces. Mon travail comporte deux volets. D'abord, j'ai développé des méthodes pour l'analyse des données génomiques. J'ai proposé une méthode (ITALICS) pour la normalisation des données Affymetrix SNP 100K et 500K. J'ai travaillé sur la segmentation des profils génomiques. J'ai développé de nouveaux outils statistiques pour étudier la stabilité de la segmentation et j'ai obtenu des formules exactes pour des critères de sélection de modèle. Enfin, j'ai propose un algorithme de programmation dynamique rapide qui retrouve la meilleure segmentation au sens de la norme euclidienne. Dans un second temps, j'ai analysé les données omiques du projet. J'ai conçu le plan d'expérience. J'ai analysé les données transcriptomiques avec des méthodes déjà disponibles. J'ai comparé les classifications transcriptomique et immunohistochimique des TNBC. L'analyse des données transcriptomiques m'a permis d'identifier des gènes et des voies de signalisation dérégulés dans les TNBC. Enfin, j'ai analysé les données génomiques avec les outils que j'ai développés.
Fichier principal
Vignette du fichier
These_GR_2010.pdf (15.68 Mo) Télécharger le fichier

Dates and versions

pastel-00593939 , version 1 (18-05-2011)

Identifiers

  • HAL Id : pastel-00593939 , version 1

Cite

Guillem Rigaill. Statistical and algorithmic developments for the analysis of Triple Negative Breast Cancers. Applications [stat.AP]. AgroParisTech, 2010. English. ⟨NNT : 2010AGPT0066⟩. ⟨pastel-00593939⟩
487 View
1231 Download

Share

Gmail Facebook Twitter LinkedIn More