Skip to Main content Skip to Navigation
Theses

Filtrage, stockage et raisonnement sur de grands volumes de triplets RDF ordonnancés

Résumé : Avec le développement et la multiplication des appareils connectés dans tous les domaines, de nouvelles solutions pour le traitement de flux de données ont vu le jour. Cette thèse s'inscrit dans ce contexte: elle a été réalisée dans le cadre du projet FUI Waves, une plateforme de traitement de flux distribués. Le cas d'usage pour le développement a été la gestion des données provenant d'un réseau de distribution d'eau potable, plus précisément la détection d'anomalie dans les mesures de qualité et leur contextualisation par rapport à des données extérieures. Plusieurs contributions ont été réalisées et intégrées à différentes étapes du projet, leur évaluation et les publications liées témoignant de leur pertinence. Celles-ci se basent sur une ontologie que j'ai spécifiée depuis des échanges avec les experts du domaine travaillant dans chez le partenaire métier du projet. L'utilisation de données géographiques a permis de réaliser un système de profilage visant à améliorer le processus de contextualisation des erreurs. Un encodage de l'ontologie adapté au traitement de flux de données RDF a été développé pour supporter les inférences de RDFS enrichis de owl : sameAs. Conjointement, un formalisme compressé de représentation des flux (PatBin) a été conçu et implanté dans la plateforme. Il se base sur la régularité des motifs des flux entrants. Enfin, un langage de requêtage a été développé à partir de ce formalisme. Il intègre une stratégie de raisonnement se basant sur la matérialisation et la réécriture de requêtes. Enfin, à partir de déductions provenant d'un d'apprentissage automatique, un outil de génération de requêtes a été implanté. Ces différentes contributions ont été évaluées sur des jeux de données concrets du domaine ainsi que sur des jeux d'essais synthétiques
Document type :
Theses
Complete list of metadatas

Cited literature [51 references]  Display  Hide  Download

https://pastel.archives-ouvertes.fr/tel-02084022
Contributor : Abes Star :  Contact
Submitted on : Friday, March 29, 2019 - 12:44:08 PM
Last modification on : Wednesday, February 26, 2020 - 7:06:07 PM
Document(s) archivé(s) le : Sunday, June 30, 2019 - 2:24:32 PM

File

TH2018PESC1122.pdf
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-02084022, version 1

Collections

Citation

Jérémy Lhez. Filtrage, stockage et raisonnement sur de grands volumes de triplets RDF ordonnancés. Autre [cs.OH]. Université Paris-Est, 2018. Français. ⟨NNT : 2018PESC1122⟩. ⟨tel-02084022⟩

Share

Metrics

Record views

107

Files downloads

318