LLM1300 Introduction aux humanités numériques

Séance 03 - Le Web 1/Chercher

Comment le paysage du Web s'est constitué et a permis aux humanités numériques de se diffuser.

Antoine Fauchié — antoine.fauchie@umontreal.ca

Plan #

  1. Rappels : Internet, le Web et ses infrastructures
  2. Les moteurs de recherche
  3. Étude de cas : Isidore.science
  4. Une perspective numérique

Extrait du documentaire World Brain de Stéphane Degoutin et Gwenola Wagon.

1. Rappels : Internet, le Web et ses infrastructures #

  • Internet : un réseau de réseaux
  • le Web : un service d’Internet
  • une infrastructure matérielle

1. Rappels : Internet, le Web et ses infrastructures #

L’intention initiale du Web #

« Hypertext »: Human-readable information linked together in an unconstrained way.

access from remote machines is essential

an important phase in the design of the system is to define this interface
Tim Berners-Lee, « Information Management: A Proposal »

2. Les moteurs de recherche #

  • pourquoi des moteurs de recherche ?
  • le PageRank : origines et fonctionnement
  • le problème des moteurs de recherche

2. Les moteurs de recherche #

Pourquoi des moteurs de recherche ? #

  • indexer le Web : les annuaires
  • la recherche par requête
  • la limite des premiers moteurs

2. Les moteurs de recherche #

Le PageRank : origines et fonctionnement #

  • comment classer des dizaines de milliers de pages web ?
  • détourner un système existant :
  • principe : définir quantitativement la popularité d’un document

Schéma du PageRank

3. Étude de cas : Isidore.science #

ISIDORE est un moteur de recherche permettant de découvrir et de trouver des publications, des données numériques et profils de chercheur·e·s en sciences humaines et sociales (SHS) venant du monde entier.

3. Étude de cas : Isidore.science #

Moissonner et enrichir #

  • Isidore construit son index en allant moissonner des entrepôts de données
  • ces données sont enrichies à partir de référentiels et de thésaurus

3. Étude de cas : Isidore.science #

Lier les données #

  • identifier les auteurs·rices
  • organiser la connaissance
  • proposer un graphe de connaissances autour d’un sujet, d’un·e auteur·rice

3. Étude de cas : Isidore.science #

Isidore aujourd’hui : du moteur de recherche à l’outil scientifique #

  • trouver de l’information
  • classer les données trouvées
  • suivre les flux
  • enrichir Isidore

4. Une perspective numérique #

Quelques ressources complémentaires #