Plan #

  1. Étude de cas : Lesbian and Gay Liberation in Canada
  2. Récolter, structurer et lier des données
  3. Les enjeux de l’archivage (rendre les données vivantes)
  4. Les DH en action

1. Étude de cas : Lesbian and Gay Liberation in Canada #

  • origines et objectifs du projet
  • les étapes de la récolte/conversion à la mise en relation
  • un projet d’archivage ?

1. Étude de cas : Lesbian and Gay Liberation in Canada #

1.1. Origines et objectifs du projet #

Présenter le mouvement de libération des gais et lesbiennes au Canada.

Mettre en relation des données pour permettre de découvrir toute la richesse et la complexité de ce mouvement.

Within the digital humanities, my research interest is in considering what the digital medium can let us know about a humanities’ content.
Constance Crompton (source)

1. Étude de cas : Lesbian and Gay Liberation in Canada #

1.2. Les étapes de la récolte/conversion à la mise en relation #

  • sources : deux ouvrages, des données textuelles (non structurées)
  • baliser chaque information : événement, personnes, etc.
  • construire un modèle de données
  • bâtir une infrastructure et une application de consultation

1. Étude de cas : Lesbian and Gay Liberation in Canada #

1.3. Un projet d’archivage ? #

  • réunir des données
  • les lier entre elles
  • donner des outils pour les interroger

2. Récolter, structurer et lier des données #

  • d’où viennent les données ?
  • rendre les données utilisables
  • lier les données

2. Récolter, structurer et lier des données #

2.1. D’où viennent les données ? #

  • un texte non structuré n’est pas utilisable
  • le travail de balisage est essentiel
  • construire une base de données requiert des choix

2. Récolter, structurer et lier des données #

2.2. Rendre les données utilisables #

  • transformer du flux en éléments identifiables
  • modéliser la structure des données
  • créer un modèle interrogeable

2. Récolter, structurer et lier des données #

2.3. Lier les données #

  • modélisation : un événement a une date, une personne participe à un événement, une publication est écrite par une personne
  • XML-TEI : implémenter un modèle
  • interroger les données pour constituer une base de données

3. Les enjeux de l’archivage #

  • description : les données sur les données
  • sauvegarde : conserver les données et pouvoir les lire
  • réutilisation : documenter la modélisation

4. Les DH en action #

  • les humanités dans la vraie vie
  • militantisme et objectivité scientifique
  • les productions en DH : que devient le code ?

Résumé des 10 séances #

  • Séance 01 - Origines des humanités numériques/Classer
  • Séance 02 - Informatique et Internet/Écrire
  • Séance 03 - Le Web 1/Chercher
  • Séance 04 - Le Web 2/Numériser
  • Séance 05 - Transcrire le texte/Encoder
  • Séance 06 - L’édition numérique 1/Lire
  • Séance 07 - Les données 1/Visualiser
  • Séance 08 - La publication académique/Structurer
  • Séance 09 - L’édition numérique 2/Publier
  • Séance 10 - Les données 2/Informer

Séance 01 - Origines des humanités numériques/Classer #

  • rencontre des humanités et de l’informatique
  • automatiser le classement/l’indexation
  • atteindre des niveaux impossibles sans le numérique
  • l’Index Thomisticus de Roberto Busa : un des premiers projets en DH

Séance 02 - Informatique et Internet/Écrire #

  • Internet : le réseau de réseaux (protocoles et infrastructures)
  • le Web : un service d’Internet
  • informatique personnelle : accès à des machines à tout faire calculer
  • Wikipédia : le livre collectif réinscriptible

Extrait du documentaire World Brain de Stéphane Degoutin et Gwenola Wagon.

Séance 03 - Le Web 1/Chercher #

  • le Web : des contenus liés de façon décentralisée
  • les moteurs de recherche : des algorithmes pour classer
  • des moteurs de recherche spécialisés : adapter les outils
  • le Web est-il devenu trop compliqué ?

«  Hypertext  »: Human-readable information linked together in an unconstrained way.
Tim Berners-Lee, «  Information Management: A Proposal  »

Séance 04 - Le Web 2/Numériser #

  • Internet, le Web et l’hypertexte : un nouvel environnement pour le texte
  • la description des documents : pour les classer et les trouver
  • la numérisation pour conserver valoriser
  • numérisation : description, photographie, OCR, mise en ligne

Séance 05 - Transcrire le texte/Encoder #

  • transcrire : donner une représentation du texte
  • traiter du texte : la sémantique avant tout
  • baliser : transcrire sans compromettre, voir enrichir
  • XML TEI : des modèles de données, une implémentation technique de la transcription

Séance 06 - L’édition numérique 1/Lire #

  • l’édition : un processus qui opère sur des contenus, en 3 fonctions) : choix et production, légitimation, et diffusion
  • utiliser le numérique : ne pas reproduire l’analogique avec de nouveaux moyens
  • livre numérique : fichier affiché sur un écran 🤔
  • des livres numériques : variété de formes

L’édition peut être comprise comme un processus de médiation qui permet à un contenu d’exister et d’être accessible. On peut distinguer trois étapes de ce processus qui correspondent à trois fonctions différentes de l’édition : une fonction de choix et de production, une fonction de légitimation et une fonction de diffusion.
(Epron et Vitali-Rosati 2018, p. 6)

Séance 07 - Les données 1/Visualiser #

  • les données : des objets numériques plus ou moins complexes
  • les données : des choses manipulables et calculables
  • visualiser des données : nouvelle appréhension du texte

Distinction entre plusieurs types de données, exemple de la notion de granularité.

We can do so much more now than find words in a string.
Geoffrey Rockwell, What is Text Analysis, Really?

Séance 08 - La publication académique/Structurer #

  • publication académique : des formats de publication et des contraintes d’édition spécifiques
  • processus de validation : fermés, ouverts, aveugles
  • une circulation de l’information complexe
  • WYSIWYG vs WYSIWYM
  • Stylo : un éditeur de texte conçu pour l’édition scientifique

Séance 09 - L’édition numérique 2/Publier #

  • éditer ≠ publier
  • la disparition des étapes intermédiaires ?
  • chaîne de publication : ensemble des méthodes, des outils et des processus qui permette de concevoir, fabriquer, produire et diffuser un livre ou plus largement une publication
  • des approches originales inspirées du Web

Within the digital humanities, my research interest is in considering what the digital medium can let us know about a humanities’ content.
Constance Crompton

Séance 10 - Les données 2/Informer #

  • modéliser les données
  • archiver : conserver les données vivantes
  • éthique et DH : la rigueur scientifique au service de la société

LLM1300 Introduction aux humanités numériques

CC BY-NC-SA Antoine Fauchié — antoine.fauchie@umontreal.ca