Compilation pour machines à mémoire répartie : une approche multipasse

Nelson Lossing

Thèse Année : 2017

Compilation for distributed memory machines : a multipass approach

Compilation pour machines à mémoire répartie : une approche multipasse

(1)

Nelson Lossing

Fonction : Auteur

Centre de Recherche en Informatique

Résumé

Scientific and simulation programs often use clusters for their execution. Programmers need new programming skills to fully take advantage of all the available resources. They have to learn how to write parallel codes, and how to manage the potentially distributed memory.This thesis aims at generating automatically a distributed parallel code for task parallelisation from a sequential code. A source-to-source compiler, PIPS, is used to achieve this goal. Our approach has two main advantages: 1) a chain of simple and modular transformations to apply, thus visible and intelligible by the users, editable and reusable, and that make new optimisations possible; 2) a proof of correctness of the parallelisation process is made, allowing to insure that the generated code is correct and has the same result as the sequential one.This automatic generation of distributed-task program for distributed-memory machines provide a simple programming interface for the users to write a task oriented code. A parallel code can thus automatically be generated with our compilation process.The experimental results obtained on two parallel machines, using Polybench kernels, show a linear to super-linear average speedup on small data sizes. For large ones, average speedup is equal to half the number of processes.

Les grilles de calculs sont des architectures distribuées couramment utilisées pour l'exécution de programmes scientifiques ou de simulation. Les programmeurs doivent ainsi acquérir de nouvelles compétences pour pouvoir tirer partie au mieux de toutes les ressources offertes. Ils doivent apprendre à écrire un code parallèle, et, éventuellement, à gérer une mémoire distribuée.L'ambition de cette thèse est de proposer une chaîne de compilation permettant de générer automatiquement un code parallèle distribué en tâches à partir d'un code séquentiel. Pour cela, le compilateur source-à-source PIPS est utilisé. Notre approche a deux atouts majeurs : 1) une succession de transformations simples et modulaires est appliquée, permettant à l'utilisateur de comprendre les différentes transformations appliquées, de les modifier, de les réutiliser dans d'autres contextes, et d'en ajouter de nouvelles; 2) une preuve de correction de chacune des transformations est donnée, permettant de garantir que le code généré est équivalent au code initial.Cette génération automatique de code parallèle distribué de tâches offre également une interface de programmation simple pour les utilisateurs. Une version parallèle du code est automatiquement générée à partir d'un code séquentiel annoté.Les expériences effectuées sur deux machines parallèles, sur des noyaux de Polybench, montrent une accélération moyenne linéaire voire super-linéaire sur des exemples de petites tailles et une accélération moyenne égale à la moitié du nombre de processus sur des exemples de grandes tailles.

Mots clés

Parallel languages Compilation Distributed memory Distribued parallel architecture Task parallelisation Automatic code generation Code verification

Langages parallèles Compilation Mémoire distribuée Architecture parallèle distribuée Parallélisation de tâche Génération automatique de code Vérification de code

Domaines

Génie logiciel [cs.SE]

Fichier principal

2017PSLEM005_archivage.pdf (1.97 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://pastel.hal.science/tel-01831194

Soumis le : jeudi 5 juillet 2018-16:50:07

Dernière modification le : vendredi 19 avril 2024-16:18:57

Archivage à long terme le : lundi 1 octobre 2018-18:39:08

Dates et versions

tel-01831194 , version 1 (05-07-2018)

Identifiants

HAL Id : tel-01831194 , version 1

Citer

Nelson Lossing. Compilation pour machines à mémoire répartie : une approche multipasse. Génie logiciel [cs.SE]. Université Paris sciences et lettres, 2017. Français. ⟨NNT : 2017PSLEM005⟩. ⟨tel-01831194⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

INSTITUT-TELECOM ENSMP PASTEL STAR ENSMP_CRI PARISTECH PSL ENSMP_DR

274 Consultations

235 Téléchargements

Compilation for distributed memory machines : a multipass approach

Compilation pour machines à mémoire répartie : une approche multipasse

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager