Chaque année le monde de la recherche accélère et développe sa production scientifique. L’apport massif de données et de publications, associé à la multiplication des canaux de diffusion, complexifie l'exploration de la littérature scientifique.
Afin de répondre à ces nouveaux enjeux, les activités de recherche bibliographique, d'état de l'art, de veille scientifique, etc. s'appuient de plus en plus sur des outils sémantiques et des logiciels de traitement de l'information. Des solutions informatiques qui permettent de repérer, d’extraire, d’organiser, de trier, de combiner, d’explorer, d’analyser et de partager un corpus de données.
Inscription
Cette formation a pour objectif de faire monter en compétence les chercheurs et chercheuses, doctorant(e)s et ingénieur(e)s d'appui à la recherche qui souhaitent mettre en place ou développer l'exploration documentaire et l'extraction d'informations dans leur activité.
Si vous souhaitez vous perfectionner ou si vous êtes appelés à utiliser ce type d'outils, il n'est pas nécessaire de savoir manipuler des bases de données ou d'avoir utilisé des logiciels de visualisation en amont. Néanmoins, une connaissance des enjeux et des méthodes de fouille de textes est fortement recommandée.
Programme
La formation se déroule sous forme de conférences plénières (démonstration) et d'ateliers pratiques (manipulation). Le programme aborde les thématiques suivantes.
Conférences
- La constitution et l'exposition d'un corpus documentaire à partir des ressources ISTEX - La fouille de texte et de données (TDM) et le positionnement de l’offre logicielle - La cartographie documentaire
Ateliers
- L'extraction d'information et l'exploration documentaire basées sur des ontologies (Alvis) - La représentation cartographique de données textuelles non structurées (GarganText) - L'apprentissage automatique pour la classification textuelle (Weka et Notebook)