Présentation de l'atelier
La plateforme ISTEX constitue un réservoir riche de plus de 23 millions de publications scientifiques accessibles à la communauté française de l'enseignement supérieur et de la recherche.
Par sa mise à disposition des documents en texte intégral, cette vaste ressource textuelle représente un matériau de choix pour réaliser des travaux de fouille de textes à des fins de recherche scientifique.
En outre, elle est associée à toute une gamme de services conçus autour de l'API ISTEX afin de simplifier et de développer son exploitation, notamment par le téléchargement de corpus volumineux (ISTEX-DL) et par l'exploration des corpus extraits permettant leur exposition sur le web (LODEX).
Cet atelier se propose de présenter la méthode de constitution d'un corpus spécialisé sur un sujet universel en utilisant les différents services associés à ISTEX afin d'obtenir à un corpus de qualité qui pourra ensuite être utilisé par des outils de fouille de texte.
Programme détaillé
Constitution d'un corpus spécialisé à partir des ressources ISTEX
- Présentation du réservoir ISTEX
- Construction d'une requête avec ISTEX-DEMO
Valorisation d'un corpus spécialisé à l'aide des services ISTEX
- Téléchargement du corpus avec ISTEX-DL
- Exploration du corpus avec l'outil LODEX pour analyser son contenu et en éliminer les éventuelles anomalies
En savoir plus