Séance 01 - Origines des humanités numériques/Classer

Version imprimable

Support de présentation (ouvrir en grand) :

Utilisez les flèches ← et → pour naviguer entre les diapositives.

Sommaire

Plan de la séance #

  1. Présentation du texte de Pierre Mounier
  2. Une rencontre entre humanités et technique ?
  3. L’Index Thomisticus de Roberto Busa : brève étude de cas

1. Présentation du texte de Pierre Mounier #

  • qui est Pierre Mounier ?
  • pourquoi ce texte en 2018 ?
  • le positionnement : donner une valeur institutionnelle aux humanités numériques

Chercheur, initiateur d’OpenEdition, d’Hypotheses ou de Revues.org, et actuellement responsable d’Operas (une infrastructure de recherche européenne pour le développement de la communication savante ouverte en sciences humaines), Pierre Mounier est l’une des figures des humanités numériques et de l’édition numérique (il a d’ailleurs co-écrit L’édition électronique avec Marin Dacos).

2. Une rencontre entre humanités et technique ? #

Humanités numériques
=
HN
=
Digital Humanities
=
DH

2. Une rencontre entre humanités et technique ? #

DH = 📖 + 💻 ? #

2. Une rencontre entre humanités et technique ? #

  • développement de l’informatique
  • origine : première application de l’informatique pour les humanités
  • première dimension : utiliser l’informatique/le numérique pour les humanités
  • deuxième dimension : repenser la façon de faire la recherche scientifique

C’est ce qu’Aurélien Berra nomme « la concordance automatique » : établir une méthode pour extraire et manipuler des milliers d’occurrences dans un texte très très long, donc profiter d’un développement technologique et l’appliquer à la recherche scientifique en sciences humaines.

D’autres rencontres entre technique et humanités sont intervenues bien avant le projet de Roberto Busa, par exemple l’invention de l’imprimerie à caractères mobiles au milieu du 15e siècle, ou Paul Otlet et ses recherches sur la documentation au début du 20e siècle.

2. Une rencontre entre humanités et technique ? #

Cette approche utilise l’informatique non pour faciliter ou accélérer le travail du chercheur, mais pour conduire l’analyse à un niveau jusqu’ici inaccessible, permettant de proposer des interprétations inédites.
Pierre Mounier

C’est peut-être le principe central des humanités numériques qu’il faudrait retenir : l’informatique ne permet pas de simplifier certains processus ou de gagner un temps précieux, il s’agit surtout d’atteindre un niveau, ou d’obtenir des résultats impossibles sans l’informatique.

Il s’agit d’observer le texte comme objet, de ne plus considérer seulement un texte en le lisant mais d’appréhender un dispositif. Et la littérature se prête bien à cela.

3. L’Index Thomisticus de Roberto Busa : brève étude de cas #

« coder » par perforation chacun des mots de l’œuvre de Thomas d’Aquin sur autant de cartes, de même que sa position dans le corpus ainsi constitué. Le positionnement des trous effectués dans la carte permet ensuite aux machines de traitement de sélectionner par procédé mécanique toutes les cartes ayant des caractéristiques similaires, ce qui permet de compter le nombre d’occurrences des différents mots et leurs différentes formes, ainsi que d’établir un index pour en situer les différentes positions dans le texte.
Pierre Mounier, « IBM ou International Busa Machines ? De l’informatique aux humanités »

3. L’Index Thomisticus de Roberto Busa : brève étude de cas #

Contexte #

  • après-guerre
  • course technologique sur fond de guerre froide
  • machinisation, mécanisation et automatisation
  • critique de la technique

3. L’Index Thomisticus de Roberto Busa : brève étude de cas #

Le projet #

  • un projet d’abord en théologie et en philosophie
  • un apport pour la linguistique
  • le premier projet en informatique linguistique
L’informatique linguistique est engendrée par la lexicométrie (« mesurer, trier, comparer, en tirer des hypothèses ou des conclusions »), l’informatique linguistique regroupe notamment la traduction automatique, le traitement automatique de la langue, l’extraction automatique de connaissances ou la stylométrie, etc.

3. L’Index Thomisticus de Roberto Busa : brève étude de cas #

Des humains, des machines et du code #

  • collaboration entre chercheur·e, ingénieur·e et opérateur·rice
  • une configuration type que l’on retrouve encore aujourd’hui
  • des développements asynchrones

3. L’Index Thomisticus de Roberto Busa : brève étude de cas #

Mais aussi #

  • une aubaine pour IBM
  • partenariat avec une entreprise privée
  • les petites mains
  • une « fascination pour le quantitatif » ?
Il faut noter que, contrairement aux pratiques d’aujourd’hui, Roberto Busa n’a probablement pas écrit une ligne du code permettant de faire fonctionner les machines informatiques qui traitaient les données. Actuellement les chercheurs réellement impliqués dans les humanités numériques sont capable de coder les applications qu’ils et elles utilisent (peut-être pas aussi bien qu’un·e développeur·euse, certes).