Minage de règles rapide, exact et exhaustif dans de larges bases de connaissances - Archive ouverte HAL Access content directly
Theses Year : 2021

Minage de règles rapide, exact et exhaustif dans de larges bases de connaissances

Fast, exact, and exhaustive rule mining in large knowledge bases

(1)
1

Abstract

The Semantic Web has quickly become a constellation of large and interconnected entity-centric Knowledge Bases. These KBs contain domain-specific knowledge that can be used for multiple application such as question answering or automatic reasoning. But in order to take full advantage of this data, it is essential to understand the schema and the patterns of the KB. A simple and expressive manner to describe the dependencies in a KB is to use rules. Thus it is crucial to be able to perform rule mining at scale.In this thesis, we introduce novel approaches and optimizations designed to speed up the process of rule mining on large Knowledge Bases. We present two algorithms that implements these optimizations: the AMIE 3 algorithm (the successor of the exact rule mining algorithm AMIE+) and the Pathfinder algorithm, a novel algorithm specialized in mining path rules. These two algorithms are exhaustive with regard to the parameters provided by the user, they compute the quality measures of each rule exactly and efficiently scale to large KB and longer rules.
Au fil des ans, le Web Sémantique s'est agrandi pour regrouper une constellation d'énorme Bases de Connaissances interconnectées. Ces bases répertorient nos connaissances du monde sous la forme de faits structurés et sont utilisées pour la réponse automatique de questions ainsi que pour le raisonnement automatique. Mais pour tirer pleinement avantages de ce vivier d'informations, il est essentiel de comprendre le schéma et les interdépendances intrinsèques à ces données. En particulier, les dépendances fonctionnelles entre les différentes relations peuvent être représentées sous la forme de règles simples. Il est donc crucial de pouvoir extraire ces règles efficacement à partir de nos données.Dans cette thèse, on introduit de nouvelles approches et optimisations pour accélérer l'extraction de règles dans de larges Bases de Connaissances. On présente deux nouveaux algorithmes implémentant ces optimisations: AMIE 3 (le successeur de l'algorithme exact AMIE+) et Pathfinder, un nouvel algorithme spécialisé dans l'extraction de règles chaînées. Ces deux algorithmes sont exhaustifs, ils calculent la qualité des règles de manière exacte et passent à l'échelle de manière efficace sur un plus grand volume de données et sur des règles plus complexes.
Fichier principal
Vignette du fichier
83597_LAJUS_2021_archivage.pdf (1.51 Mo) Télécharger le fichier
Origin : Version validated by the jury (STAR)

Dates and versions

tel-03237830 , version 1 (26-05-2021)

Identifiers

  • HAL Id : tel-03237830 , version 1

Cite

Jonathan Lajus. Minage de règles rapide, exact et exhaustif dans de larges bases de connaissances. Artificial Intelligence [cs.AI]. Institut Polytechnique de Paris, 2021. English. ⟨NNT : 2021IPPAT002⟩. ⟨tel-03237830⟩
222 View
198 Download

Share

Gmail Facebook Twitter LinkedIn More