Plan #

  1. Rappels sur le Web : documents, hypertexte, espace de lecture
  2. Préambule : qu’est-ce qu’un texte ?
  3. Référencer et signaler : catalogues et bases de données
  4. Donner accès : les versions du document
  5. Valoriser : penser des parcours

1. Rappels sur le Web : documents, hypertexte, espace de lecture #

  • documents : bibliothèques (in)finies
  • hypertexte : lier des documents
  • espace de lecture : reconfiguration en fonction des dispositifs

Schéma de l’hypertexte pensé par Ted Nelson en 1965

2. Préambule : qu’est-ce qu’un texte ? #

  • un texte n’est pas du texte au kilomètre
  • importance de la structure et des métadonnées
  • ordered hierarchy of content object

3. Référencer et signaler : catalogues et bases de données #

  • décrire les documents : l’importance des métadonnées
  • classer les notices
  • chercher dans les notices

Le texte de Thomas Lebarbé et Cécile Meynard #

Le texte de Thomas Lebarbé et Cécile Meynard #

  • qu’est-ce qu’une édition numérique d’un manuscrit ?
  • numériser, convertir et valoriser
  • numériser pour conserver numériser pour convertir pour valoriser
  • pensée la relation entre l’imprimé (voir le manuscrit) et le numérique

4. Donner accès : les versions du document #

  • qu’est-ce que numériser un document ?
  • vous avez dit OCR ?
  • donner accès à la source

5. Valoriser : penser des parcours #

  • proposer des accès différents selon les utilisateurs·trices potentiels·lles
  • créer de nouveaux objets éditoriaux
  • imaginer des liens originaux à l’intérieur d’un corpus

Évaluation de mi-session : exemples de questions #

Pourquoi le projet de Roberto Busa constitue un point de départ des humanités numériques ? #

L’Index Thomisticus de Roberto Busa constitue un point d’achoppement : c’est l’un des premiers projets d’envergure où les humanités ont recours à l’informatique. Dans les années 1950, Roberto Busa entre en contact avec l’entreprise d’informatique IBM, et va ainsi utiliser les potentialités (encore balbutiantes) des ordinateurs pour enregistrer et classer les occurrences de termes dans l’œuvre de Saint-Thomas d’Aquin. C’est grâce à l’informatique qu’il fait des découvertes linguistiques insoupçonnées, ainsi le numérique n’a pas seulement été un accélérateur ou facilitateur, mais il a proposé un nouveau paradigme pour la recherche scientifique en sciences humaines.

Qu’est-ce que permet de faire une structuration fine d’un document ? #

Structurer un document signifie retranscrire ses particularités sémantiques : niveaux de titres, listes ordonnées ou non ordonnées, blocs de contenus comme une citation longue, emphase, note de bas de page, etc. Si un document est suffisamment structuré, alors il est possible d’automatiser certaines actions sur le document en question. Afficher une citation longue avec une typographie ou une couleur spécifiques devient facile, de même qu’extraire toutes les citations d’un même document. La structuration fine d’un document est donc un atout pour réaliser des traitements, des recherches, des visualisations ou d’autres actions sur un document, en l’occurrence un texte.

LLM1300 Introduction aux humanités numériques

CC BY-NC-SA Antoine Fauchié — antoine.fauchie@umontreal.ca