Soutenance de thèse de Maroua Tikat
mercredi 18 septembre 2024
Maroua Tikat défendra sa thèse de doctorat le mercredi 18 septembre 2024 à 9h30 dans l'amphi FORUM - Université Côte d'Azur - Campus SophiaTech.
Sa thèse intitulée « Contribution à l’annotation interactive de graphes de connaissances multidimensionnels : une étude de cas sur les données de musique populaire » a été réalisée dans le pôle SPARKS sous la direction de Michel Buffa et Marco Winckler.
Résumé :
Cette thèse se concentre sur l’exploration de grands ensembles de données musicales, telles que le one million song dataset ou le WASABI dataset qui offrent un riche ensemble de métadonnées concernant les chansons populaires enregistrées de 1950 à ces dernières années. Ces datasets sont représentés par des graphes de grande taille et peuvent servir à un large éventail d’applications, telles que le journalisme de données, la recherche musicologique, les systèmes de recommandation pour les services de diffusion de musique en continu et l’analyse des œuvres musicales. Toutefois, la navigation et le traitement des vastes quantités d’informations contenues dans ces graphes peuvent s’avérer complexes.
Cette thèse présente une approche centrée sur l’utilisateur qui propose l’annotation interactive de graphes de connaissances, avec une application sur le graphe de connaissances musicales WASABI. La méthode présentée permet aux utilisateurs d’ajouter des annotations tout en explorant le dataset par le biais d’un site web, ainsi que par le biais de certaines techniques de visualisation. Les utilisateurs peuvent utiliser les annotations pour documenter les problèmes de qualité de données, poser des questions et commenter les données présentées. Les annotations peuvent également être utilisées pour fournir un contexte et aider à enrichir le dataset en reliant les entités présentes dans les données textuelles à des éléments externes.
Cette approche a abouti au développement de quatre outils : le premier a été conçu pour annoter les pages web du site d’exploration du dataset WASABI, le second pour annoter les données du dataset présentées à l’aide de techniques de visualisation, le troisième est une extension de navigateur permettant d’annoter des sites web en dehors de WASABI, et le dernier est un outil permettant de visualiser et d’analyser les contributions/annotations des utilisateurs afin d’assurer leur interprétabilité avec différents niveaux d’analyse. Le processus de développement a été guidé par la méthodologie Action Design Research (ADR). Enfin, la thèse montre que l’approche et les outils utilisés ont été pensés pour être applicables à d’autres datasets que le dataset WASABI, grace à leur conception générique.