Défis algorithmiques pour les simulations biomoléculaires et la conception de protéines

Résumé : Le dessin computationnel de protéine, ou CPD, est une technique qui permet de modifier les protéines pour leur conférer de nouvelles propriétés, en exploitant leurs structures 3D et une modélisation moléculaire. Pour rendre la méthode de plus en plus prédictive, les modèles employés doivent constamment progresser. Dans cette thèse, nous avons abordé le problème de la représentation explicite de la flexibilité du squelette protéique. Nous avons développé une méthode de dessin "multi-états", qui se base sur une bibliothèque discrète de conformations du squelette, établie à l'avance. Dans un contexte de simulation Monte Carlo, le paysage énergétique d'une protéine étant rugueux, les changements de squelettes ne peuvent etre acceptés que moyennant certaines précautions. Aussi, pour explorer ces conformations, en même temps que des mutations et des mouvements de chaînes latérales, nous avons introduit un nouveau type de déplacement dans une méthode Monte Carlo existante. Il s'agit d'un déplacement "hybride", où un changement de squelette est suivi d'une courte relaxation Monte Carlo des chaînes latérales seules, après laquelle un test d'acceptation est effectué. Pour respecter une distribution de Boltzmann des états, la probabilité doit avoir une forme précise, qui contient une intégrale de chemin, difficile à calculer en pratique. Deux approximations sont explorées en détail: une basée sur un seul chemin de relaxation, ou chemin "générateur" (Single Path Approximation, ou SPA), et une plus complexe basée sur un ensemble de chemins, obtenus en permutant les étapes élémentaires du chemin générateur (Permuted Path Approximation, ou PPA). Ces deux approximations sont étudiées et comparées sur deux protéines. En particulier, nous calculons les énergies relatives des conformations du squelette en utilisant trois méthodes différentes, qui passent réversiblement d'une conformation à l'autre en empruntent des chemins très différents. Le bon accord entre les méthodes, obtenu avec de nombreuses paramétrisations différentes, montre que l'énergie libre se comporte bien comme une fonction d'état, suggérant que les états sont bien échantillonnés selon la distribution de Boltzmann. La méthode d'échantillonnage est ensuite appliquée à une boucle dans le site actif de la tyrosyl-ARNt synthétase, permettant d'identifier des séquences qui favorisent une conformation, soit ouverte, soit fermée de la boucle, permettant en principe de contrôler ou redessiner sa conformation. Nous décrivons enfin un travail préliminaire visant à augmenter encore la flexibilité du squelette, en explorant un espace de conformations continu et non plus discret. Ce changement d'espace oblige à restructurer complètement le calcul des énergies et le déroulement des simulations, augmente considérable le coût des calculs, et nécessite une parallélisation beaucoup plus agressive du logiciel de simulation.
Type de document :
Thèse
Bio-Informatique, Biologie Systémique [q-bio.QM]. Université Paris-Saclay, 2016. Français. 〈NNT : 2016SACLX080〉
Liste complète des métadonnées

https://pastel.archives-ouvertes.fr/tel-01502014
Contributeur : Abes Star <>
Soumis le : mardi 4 avril 2017 - 23:32:08
Dernière modification le : jeudi 10 mai 2018 - 02:07:58
Document(s) archivé(s) le : mercredi 5 juillet 2017 - 18:30:13

Fichier

58170_DRUART_2016_archivage.pd...
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01502014, version 1

Citation

Karen Druart. Défis algorithmiques pour les simulations biomoléculaires et la conception de protéines. Bio-Informatique, Biologie Systémique [q-bio.QM]. Université Paris-Saclay, 2016. Français. 〈NNT : 2016SACLX080〉. 〈tel-01502014〉

Partager

Métriques

Consultations de la notice

433

Téléchargements de fichiers

229