DEQUALIN - améliorer la DÉcouvrabilité, la QUALité et l’INtelligibilité des données ouvertes
📆 janvier 2019
⏱️ Trois ans
Équipe
🔎 Le projet scientifique
Ce projet visait à produire des connaissances nouvelles qui permettront de surmonter les obstacles à la réutilisation des données.
Le premier obstacle concerne la capacité d’un utilisateur à trouver les jeux de données qu’il cherche, qui repose en retour sur la capacité d’un jeu de données à être trouvé ou découvert.
Le second obstacle que rencontrent les réutilisateurs, s'ils ont trouvé un jeu de données pertinent, est celui du niveau de qualité des données et des métadonnées.
Le troisième obstacle principal que rencontrent les réutilisateurs est la difficulté d’utiliser des données non-structurées, a fortiori distribuées dans un format non-lisible par la machine comme les fichiers PDF.
Ce projet a notamment donné lieu à (1) des données annotées ouvertes, (2) du code source et des modèles prédictifs publiés sous licence ouverte (MIT), (3) des supports didactiques ou pédagogiques sous licence ouverte, (4) des publications.
Le premier obstacle concerne la capacité d’un utilisateur à trouver les jeux de données qu’il cherche, qui repose en retour sur la capacité d’un jeu de données à être trouvé ou découvert.
Le second obstacle que rencontrent les réutilisateurs, s'ils ont trouvé un jeu de données pertinent, est celui du niveau de qualité des données et des métadonnées.
Le troisième obstacle principal que rencontrent les réutilisateurs est la difficulté d’utiliser des données non-structurées, a fortiori distribuées dans un format non-lisible par la machine comme les fichiers PDF.
Ce projet a notamment donné lieu à (1) des données annotées ouvertes, (2) du code source et des modèles prédictifs publiés sous licence ouverte (MIT), (3) des supports didactiques ou pédagogiques sous licence ouverte, (4) des publications.
🔬 Méthode
Utilisation des méthodes issues du domaine du traitement automatique du langage (TAL) pour la constitution, l’annotation et l’analyse de bases de données
📋 Réalisations

