Deciphering splicing with sparse regression techniques in the era of high-throughput RNA sequencing.

Résumé : Le nombre de gènes codant pour des protéines chez l’'homme, le vers rond et la mouche des fruits est du même ordre de grandeur. Cette absence de correspondance entre le nombre de gènes d’un eucaryote et sa complexité phénotypique s’explique en partie par le caractère alternatif de l’épissage.L'épissage alternatif augmente considérablement le répertoire fonctionnel de protéines codées par un nombre limité de gènes. Ce mécanisme, très actif lors du développement embryonnaire, participe au devenir cellulaire. De nombreux troubles génétiques, hérités ou acquis (en particulier certains cancers), se caractérisent par une altération de son fonctionnement.Les technologies de séquençage à haut débit de l'ARN donnent accès a une information plus riche sur le mécanisme de l’épissage. Cependant, si la lecture à haut débit des séquences d’ARN est plus rapide et moins coûteuse, les données qui en sont issues sont complexes et nécessitent le développement d’outils algorithmiques pour leur interprétation. En particulier, la reconstruction des transcrits alternatifs requiert une étape de déconvolution non triviale.Dans ce contexte, cette thèse participe à l'étude des événements d'épissage et des transcrits alternatifs sur des données de séquençage à haut débit de l'ARN.Nous proposons de nouvelles méthodes pour reconstruire et quantifier les transcrits alternatifs de façon plus efficace et précise. Nos contributions méthodologiques impliquent des techniques de régression parcimonieuse, basées sur l'optimisation convexe et sur des algorithmes de flots. Nous étudions également une procédure pour détecter des anomalies d'épissage dans un contexte de diagnostic clinique. Nous suggérons un protocole expérimental facilement opérant et développons de nouveaux modèles statistiques et algorithmes pour quantifier des événements d’épissage et mesurer leur degré d'anormalité chez le patient.
Type de document :
Thèse
Bioinformatics [q-bio.QM]. PSL Research University, 2016. English. 〈NNT : 2016PSLEM063〉
Liste complète des métadonnées

Littérature citée [200 références]  Voir  Masquer  Télécharger

https://pastel.archives-ouvertes.fr/tel-01681314
Contributeur : Abes Star <>
Soumis le : vendredi 12 janvier 2018 - 10:36:08
Dernière modification le : mardi 13 novembre 2018 - 10:11:46
Document(s) archivé(s) le : mercredi 23 mai 2018 - 19:42:29

Fichier

2016PSLEM063_archivage.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01681314, version 2

Collections

Citation

Elsa Bernard. Deciphering splicing with sparse regression techniques in the era of high-throughput RNA sequencing.. Bioinformatics [q-bio.QM]. PSL Research University, 2016. English. 〈NNT : 2016PSLEM063〉. 〈tel-01681314v2〉

Partager

Métriques

Consultations de la notice

282

Téléchargements de fichiers

100