Datactivist Logo
Research

DEQUALIN - améliorer la DÉcouvrabilité, la QUALité et l’INtelligibilité des données ouvertes

📆 janvier 2019
⏱️ Trois ans

Équipe

🔎 Le projet scientifique

Ce projet visait à produire des connaissances nouvelles qui permettront de surmonter les obstacles à la réutilisation des données.
Le premier obstacle concerne la capacité d’un utilisateur à trouver les jeux de données qu’il cherche, qui repose en retour sur la capacité d’un jeu de données à être trouvé ou découvert.
Le second obstacle que rencontrent les réutilisateurs, s'ils ont trouvé un jeu de données pertinent, est celui du niveau de qualité des données et des métadonnées.  
Le troisième obstacle principal que rencontrent les réutilisateurs est la difficulté d’utiliser des données non-structurées, a fortiori distribuées dans un format non-lisible par la machine comme les fichiers PDF.
Ce projet a notamment donné lieu à (1) des données annotées ouvertes, (2) du code source et des modèles prédictifs publiés sous licence ouverte (MIT), (3) des supports didactiques ou pédagogiques sous licence ouverte, (4) des publications.

🔬 Méthode

Utilisation des méthodes issues du domaine du traitement automatique du langage (TAL) pour la constitution, l’annotation et l’analyse de bases de données 

📋 Réalisations

publication dans un workshop d’une conférence internationale (NAACL 2019) 
rédaction d’articles dans le cadre de conférences francophones et internationales
Conception et développement d’un outil facilitant la recherche de jeux de données (projet de conciergerie de données) 
Reference image

Contenus liés