Extraction de motifs fréquents dans des arbres attribués

Abstract

L'extraction de motifs fréquents est une tâche importante en fouille de données. Initialement centrés sur la découverte d'ensembles d'items fréquents, les premiers travaux ont été étendus pour extraire des motifs structurels comme des séquences, des arbres ou des graphes. Dans cet article, nous proposons une nouvelle méthode de fouille de données qui consiste à extraire de nouveaux types de motifs à partir d'une collection d'arbres attribués. Les arbres attribués sont des arbres dans lesquels les nœuds sont associés à des ensembles d'attributs. L'extraction de ces motifs (appelés sous-arbres attribués) combine une recherche d'ensembles d'items fréquents à une recherche de sous-arbres et nécessite d'ex- plorer un immense espace de recherche. Nous présentons plusieurs nouveaux algorithmes d'extraction d'arbres attribués et montrons que leurs implémenta- tions peuvent efficacement extraire des motifs fréquents à partir de grands jeux de données.

Publication
13ème Conférence Francophone sur l'Extraction et la Gestion des Connaissances (EGC'13). Revue des Nouvelles Technologies de l'Information, volume E-24

Related