Plan #
1. Rappels : Internet, le Web et ses infrastructures #
- Internet : un réseau de réseaux
- le Web : un service d’Internet
- une infrastructure matérielle
1. Rappels : Internet, le Web et ses infrastructures #
L’intention initiale du Web #
« Hypertext »: Human-readable information linked together in an unconstrained way.
…
access from remote machines is essential
…
an important phase in the design of the system is to define this interface
Tim Berners-Lee, « Information Management: A Proposal »
2. Les moteurs de recherche #
- pourquoi des moteurs de recherche ?
- le PageRank : origines et fonctionnement
- le problème des moteurs de recherche
2. Les moteurs de recherche #
Pourquoi des moteurs de recherche ? #
- indexer le Web : les annuaires
- la recherche par requête
- la limite des premiers moteurs
2. Les moteurs de recherche #
Le PageRank : origines et fonctionnement #
- comment classer des dizaines de milliers de pages web ?
- détourner un système existant :
- principe : définir quantitativement la popularité d’un document
3. Étude de cas : Isidore.science #
ISIDORE est un moteur de recherche permettant de découvrir et de trouver des publications, des données numériques et profils de chercheur·e·s en sciences humaines et sociales (SHS) venant du monde entier.
3. Étude de cas : Isidore.science #
Moissonner et enrichir #
- Isidore construit son index en allant moissonner des entrepôts de données
- ces données sont enrichies à partir de référentiels et de thésaurus
3. Étude de cas : Isidore.science #
Lier les données #
- identifier les auteurs·rices
- organiser la connaissance
- proposer un graphe de connaissances autour d’un sujet, d’un·e auteur·rice
3. Étude de cas : Isidore.science #
Isidore aujourd’hui : du moteur de recherche à l’outil scientifique #
- trouver de l’information
- classer les données trouvées
- suivre les flux
- enrichir Isidore
4. Une perspective numérique #
- une mauvaise tournure ?
- un monde de compromis ?
- web0, Gemini, Le Web des gens, etc.
Quelques ressources complémentaires #
- Une histoire de… l’Internet, une série de podcasts sur France Culture
- [Le documentaire World Brain de Stéphane Degoutin et Gwenola Wagon](https://vimeo.com/381166153#t=80s](https://vimeo.com/381166153#t=80s)
- Il était une fois Internet, une série de conférences sur le fonctionnement, les enjeux et les protocoles d’Internet
- 6|5, un livre d’Alexandre Laumonier sur le trading à haute fréquence, avec en creux une histoire des communications (livre disponible à la Bibliothéque universitaire).
LLM1300 Introduction aux humanités numériques
CC BY-NC-SA Antoine Fauchié — antoine.fauchie@umontreal.ca