• Recherche - CLM,
  • Recherche - DSP,
  • Recherche - EOS,
  • Recherche - ETC,
  • Recherche - LLS,
  • Recherche - SSMM,

Constitution et analyse d'un corpus documentaire à partir d'Istex

Publié le 10 juillet 2025 Mis à jour le 10 juillet 2025
Date(s)

du 17 mars 2026 au 24 mars 2026

Date : 17 et 24 mars 2026
Durée : 6h
Horaires : 9h30 à 12h30
Format : distanciel
Lieu  :
Nombre de participants maximum : 20
Public visé : tous les doctorants
Public conseillé (1ère, 2e, 3e Année, etc.) : 1ère année
Type de formation : professionnelle
Pré-requis pour la formation : Ordinateur, connexion internet
Nom des intervenant.e.s : Mathilde Huguin, ingénieure de recherche CNRS
Peut-on suivre uniquement certains modules de cette formation ? : NON
Mode d’inscription : ADUM


CONTEXTE

L’infrastructure Istex donne accès à plus de 30 millions de publications scientifiques en texte intégral, couvrant un large éventail disciplinaire. Au-delà de ce vaste réservoir, Istex propose également des outils pour analyser, visualiser et exploiter ces données, facilitant ainsi l’exploration de corpus de grande taille.
Cette formation montrera comment mobiliser Istex pour construire une bibliographie pertinente, automatiser la recherche d’informations dans des milliers de documents, et gagner du temps dans l’analyse de la littérature scientifique grâce à des méthodes d’analyse textuelle. Cette formation se décline en deux séances complémentaires de trois heures chacune.

OBJECTIFS
  • Présenter l’infrastructure Istex (base et outils associés)
  • Former les stagiaires à la méthodologie de constitution de corpus
  • Faire découvrir des outils de constitution de corpus et de fouille de textes (ou TDM pour text and data mining).

PROGRAMME
  • Séance 1 – Recherche bibliographique - 17 mars 2026 de 9h30 à 12h30
Cette première session est consacrée à l’exploitation d’Istex pour la constitution d’une bibliographie scientifique ciblée. Elle permettra aux participant·es d’apprendre à formuler des requêtes efficaces et à naviguer dans l’éco-système Istex.
  • Séance 2 – Constitution de corpus et fouille de textes - 24 mars 2026 de 9h30 à 12h30
La seconde session portera sur la constitution, l’enrichissement et l’analyse d’un corpus scientifique. Elle présentera des outils accessibles pour explorer les contenus et rechercher automatiquement des informations dans des corpus de plusieurs milliers de documents. Nous manipulerons notamment :
  • Lodex, un outil de data visualisation permettant d’identifier, par exemple, les auteurs les plus cités ou les documents de référence dans un domaine ;
  • Les web-services Istex TDM, des programmes informatiques prêts à l’emploi (utilisables sans connaissance en programmation), s’appuyant sur des techniques d’intelligence artificielle pour analyser un corpus.
Chaque séance combinera apports théoriques, exemples concrets et travaux pratiques afin de permettre une appropriation progressive des outils et méthodes proposés.

Mis à jour le 10 juillet 2025