Séance 02 - Informatique et Internet/Écrire

Version imprimable

Support de présentation (ouvrir en grand) :

Utilisez les flèches ← et → pour naviguer entre les diapositives.

Sommaire

Plan de la séance #

  1. Rappel : histoire des humanités numériques
  2. Histoire d’Internet (invité : Marcello Vitali-Rosati)
  3. Discussion autour du texte d’Alain Mille
  4. Wikipédia, le livre numérique ultime ?
  5. 5 termes dans le glossaire : humanités, numérique, technique, informatique et Internet

1. Rappel : histoire des humanités numériques #

  • l’événement historique : l’Index Thomisticus de Roberto Busa
  • l’évolution technique clé : l’informatique
  • les origines : systèmes d’indexation
  • les prémisses : philosophie et technique

Dans la séance précédente nous avons vu une des origines des humanités numériques avec le projet de l’Index Thomisticus de Roberto Busa : l’indexation de milliers de termes extraits de l’œuvre de Saint Thomas d’Aquin. Cette rencontre entre un prêtre/théologien et une entreprise d’informatique (IBM) a permis de mettre en place une nouvelle organisation et de nouveaux processus de recherche en sciences humaines. Comme nous l’avons vu la semaine dernière, l’utilisation de l’informatique ou plus globalement de la technique en humanités n’est pas seulement à des fins de facilitation ou d’accélération de la recherche, il s’agit de repenser la façon dont les sciences humaines se constituent. Il s’agit, de façon encore plus globale, de reconsidérer notre rapport au monde à travers les moyens que nous mettons en œuvre pour le comprendre et le faire comprendre.

L’évolution clé est l’arrivée de l’informatique, permettant à Roberto Busa d’envisager son utilisation — presque son détournement, puisque l’informatique était alors utilisée pour des usages moins scientifiques comme le recensement ou les calculs balistiques des militaires.

Mais nous pouvons revenir en arrière pour comprendre que les humanités numériques ont commencé avant le projet du père Busa, avec des systèmes d’indexation tout d’abord, et ensuite avec un recul plus important que la relation entre philosophie et technique.

Photographie du système de classement documentaire de Paul Otlet, à base de fiches papier

1. Rappel : histoire des humanités numériques #

Des systèmes d’indexation #

  • le projet de Paul Otlet : savoir, index et paix
  • vous avez dit « digital » ?

Le projet de Paul Otlet est ambitieux : au début du 20e siècle il met en place un système de documentation permettant de regrouper toutes les informations écrites sur tous les sujets, le Mundaneum. Cette méta-encyclopédie est un ensemble de fiches répertoriant toutes les connaissances sur tous les sujets. L’enjeu ici étant de définir un classement pour réussir à organiser plusieurs millions de fichiers papier. L’objectif inhérent de ce projet : regrouper tous le savoir humain dans un index, avec ce rêve fou que si toute personne peut accéder aux connaissances, alors nous pouvons envisager de vivre dans la paix.

Nous l’avons rapidement évoqué la semaine dernière, pourquoi les humanités numériques ne s’appellent pas « humanités digitales » ? Tout d’abord il faut noter que le terme de « digital » n’a pas la même signification en français (relatif au doigt) et en anglais (représentation d’une information discrète, et par extension ce qui correspond à l’informatique à l’ère de l’information). Ensuite il y a un débat autour de cette question de concept qui est très intéressant et qui permet de comprendre le croisement de plusieurs approches :

  • la conception des humanités numériques comme une démarche d’indexation ;
  • une conception plus large concernant la synergie qui peut exister entre une recherche scientifique et l’usage de l’informatique/du numérique.

Pythagore

1. Rappel : histoire des humanités numériques #

Par où commencer ? #

  • Pythagore ?
  • Leibniz ?
  • légitimité de l’histoire officielle

C’est la deuxième piste de l’origine des humanités numériques : le fait que le monde soit modélisable de façon fonctionnelle. C’est l’atomisation et la discrétisation du monde : le monde est transformable en un modèle calculable.

1. Rappel : histoire des humanités numériques #

Histoire des Digital Humanities #

  • 1980 Humanities Computing : généralisation des pratiques
  • 1990 Digital Humanities
  • Naissance de revues, web, moteurs de recherche, Google (1998)...
  • Changements de paradigme...
  • Numérisation (Érudit, 1998, revues.org 1999, Persée 2003, Cairn 2006, rechercheisidore.fr 2009)
  • Fonction culturelle : Humanisme numérique

1. Rappel : histoire des humanités numériques #

Questionnements importants #

  • digital ?
  • articulation humains et technique
  • comment émerge le savoir avec le numérique ?

2. Histoire d’Internet (invité : Marcello Vitali-Rosati) #

2. Histoire d’Internet #

Quand ? #

À quand ça remonte ? Difficile d’établir un début…

  • Le concept de réseau…
  • Construction de routes
  • Relais de Poste
  • Canalmania? (1790)
  • Raylway mania? (1820)
  • Télégraphe? (1851 Manche, 1866 Atlantique)

2. Histoire d’Internet #

Quelques dates clés #

  • 1950
  • Situation politique (les technologies ne sont jamais sans rapport avec la politique!)
  • Recherche universitaire
  • Paul Baran : une réseau moins hiérarchisé pour des raisons militaires… Projet non réalisé
  • ARPAnet (1967, première connexion 1969) : financement militaire
  • 1972 les Hippies veulent créer la People’s Computer Company
  • 1974 et 1978 Vint Cerf : TCP, puis IP
  • 1976 Wozniak et Jobs créent Apple

Apple II

2. Histoire d’Internet #

L’ordinateur #

Minitel

2. Histoire d’Internet #

  • 1978 Minitel
  • Ethernet 1980
  • 1980 Usenet (réseau Unix)

Terminal affichant des informations de BITnet, le réseau d’IBM

2. Histoire d’Internet #

Différents réseaux #

  • 1981 BITnet (réseau IBM)
  • 1984 National Science Foundation : interconnecter les réseaux régionaux (financement du gouvernement US, Al Gore)
  • Inter- net

2. Histoire d’Internet #

Publications #

  • 1990 Surfaces… la première revue numérique francophone Jean-Claude Guédon, Département de littérature comparée UdeM

2. Histoire d’Internet #

Le Web #

3 principes pour que le partage d’information fonctionne, 3 conditions pour l’existence du Web :

  • un identifiant de ressource unique : URI ou URL
  • un protocole de communication pour transférer des hypertextes : HTTP
  • un format standardisé pour les documents partagés : HTML

2. Histoire d’Internet #

Aujourd’hui #

  • 1994 Yahoo!, Amazon
  • 1998 Google
  • 2001 Wikipédia
  • 2004 Facebook
  • 2008 Airbnb

Et en même temps:

  • 2013: W2V
  • 2018: Google Translate commence à utiliser des réseaux de Neurones
  • IA et échecs

3. Discussion autour du texte d’Alain Mille #

Mille, A. (2014). D’Internet au web. Dans Pratiques de l’édition numérique. Presses de l’Université de Montréal. Consulté à l’adresse https://www.parcoursnumeriques-pum.ca/1-pratiques/chapitre2.html

#

4. Wikipédia, le livre réinscriptible #

Capture d’écran de wikipedia.org

Cette étude de cas va nous permettre de prendre en considération les différentes thématiques vues aujourd’hui :

4. Wikipédia, le livre réinscriptible #

Qu’est-ce que Wikipédia ? #

  • une encyclopédie
  • en ligne
  • libre
  • participative

Wikipédia est, d’après sa propre définition :

Wikipédia est une encyclopédie universelle et multilingue créée par Jimmy Wales et Larry Sanger le 15 janvier 2001. Il s’agit d’une œuvre libre, c’est-à-dire que chacun est libre de la rediffuser. Gérée en wiki dans le site web wikipedia.org grâce au logiciel MediaWiki, elle permet à tous les internautes d’écrire et de modifier des articles, ce qui lui vaut d’être qualifiée d’encyclopédie participative. Elle est devenue en quelques années l’encyclopédie la plus fournie et la plus consultée au monde.
Source

C’est une encyclopédie : elle regroupe des articles sur toute la connaissance humaine, avec des références à d’autres modes de constitution du savoir comme des articles scientifiques, des articles de presse, des monographies, etc. Avant l’apparition de Wikipédia, les encyclopédies étaient le plus souvent imprimées, et parfois en version CD-Rom.

L’un des changements les plus importants est le fait que cette encyclopédie est libre : quiconque souhaite réutiliser les contenus peut le faire librement, à deux conditions : citer Wikipédia et distribuer les contenus avec une licence équivalente.

Enfin, Wikipédia est une encyclopédie participative : à condition de respecter un certain nombre de prérogatives, n’importe qui peut contribuer.

4. Wikipédia, le livre réinscriptible #

Pourquoi s’intéresser à Wikipédia ? #

  • objet d’étude des humanités numériques
  • outil pour les humanités numériques
  • objet numérique qui rassemble beaucoup des thématiques liées au DH

Wikipédia regroupe beaucoup de données, interrogeables de plusieurs façons (interface web, API, requêtes SPARQL, etc.), permettant aux chercheur·e·s de consulter et d’utiliser les informations disponibles. Par exemple si vous souhaitez savoir tous les articles qui sont regroupés dans une catégorie particulières, le nombre de modifications de pages lors d’événements particuliers (lors d’élections notamment), ou encore les articles créés ou modifiés par une personne ou une organisation (via l’adresse IP).

Wikipédia est un bon exemple de projet humaniste (ici diffuser le plus largement les connaissances) possible grâce à la technologie. Wikipédia utilise le logiciel MediaWiki, un « moteur de wiki » qui permet de gérer plusieurs aspects :

  • mettre à disposition une interface en WYSIWYG pour créer, modifier et gérer des pages. Il s’agit d’une sorte de CMS ;
  • intégrer la gestion des versions : l’historique des modifications est conservé, et il est même possible de naviguer à l’intérieur d’elles ;
  • créer des profils utilisateurs ;
  • disposer d’espaces de discussion — Wikipédia est autant une encyclopédie (la partie visible) qu’un espace d’écriture et d’édition (la partie moins visible) ;
  • etc.

Capture d’écran de l’interface de MediaWiki permettant de modifier les contenus de la page Wikipédia.

4. Wikipédia, le livre réinscriptible #

Dans les détails #

  • écriture numérique : balisage, versionnement, historique, identification, robots
  • une communauté très active
  • lecture numérique : interface web, site adaptatif, API
  • web sémantique : lire Wikipédia sans lire Wikipédia
  • un projet dans le projet : Wikimédia, Wikidata, etc.

Wikipédia propose deux modes d’édition : l’un en WYSIWYG (Ce que vous voyez est ce que vous obtenez) pour modifier facilement du texte, avec l’aide de quelques boutons pour la structuration et la mise en forme ; l’autre en WYSIWYM (Ce que vous voyez est ce que vous signifiez) pour modifier le balisage du texte, ce qui permet une plus grande précision, mais aussi un apprentissage (minimal). Ce balisage est le cœur de Wikipédia, car il permet de faire facilement des liens internes et externes, ainsi que d’insérer facilement des images ou des références bibliographiques. Par ailleurs, un certain nombre d’indicateurs permettent de pouvoir qualifier les pages : très bonne qualité, références à ajouter, contenus obsolètes, etc.

Le versionnement est un point essentiel de Wikipédia : il est possible de voir toutes les modifications successives d’une page, mais aussi de revenir sur une version précédente si des erreurs ont été commises.

Capture d’écran de l’interface de MediaWiki avec le balisage propre à ce logiciel.

Wikipédia utilise des robots pour vérifier automatiquement certains contenus, par exemple si une modification a été faite par un nouvel utilisateur, ou si beaucoup de modifications sont faites sur une même page. L’objectif est de réduire les interventions qui pourraient nuire à la validité des informations.

La communauté de Wikipédia est très active, il y a tout un fonctionnement permettant de gérer les pages, de discuter de certains ajouts ou modifications, etc.

Capture d’écran de l’historique d’une page Wikipédia.

Capture d’écran des différences entre deux états d’une page.

D’autres projets cohabitent ou sont intimement liés à Wikipédia : Wikimédia Commons pour tous les contenus graphiques, ou WikiData qui regroupe des millions de données, elles-même utilisées dans Wikipédia.

4. Wikipédia, le livre réinscriptible #

Un changement de paradigme #

  • toute contribution est possible tant qu’elle est sourcée/référencée
  • les contenus sont libres
  • une évolution permanente
  • etc.

Est-ce que Wikipédia est moins fiable qu’une autre encyclopédie ? Il y a un certain nombre de … L’idée est aussi que tous lecteurs ou lectrices puissent lui-même vérifier que les contenus sont valides : par exemple en constatant ou non l’usage de références.

Les contenus sont libres, et c’est un changement fondamental dans la diffusion du savoir, jusqu’ici limité à quelques entreprises privées qui éditaient et diffusaient les encyclopédies. Le fait de pouvoir consulter, réutiliser, modifier et diffuser ces modifications change profondément la façon dont la connaissance est produite, comprise et diffusée.

S’il est possible d’imprimer Wikipédia (d’ailleurs un certain nombre d’artistes se sont amusés à le faire), cela n’a plus vraiment de sens : les contenus peuvent être modifiés à n’importe quel moment, l’idée est donc ici de consulter cet objet numérique avec des moyens numériques.

4. Wikipédia, le livre réinscriptible #

Le livre numérique ultime #

  • un livre numérique : contenus qui s’adaptent au dispositif de lecture avec écran ;
  • référence à une conférence de Pierre Mounier : lecture/écriture continu ;
  • objet clos (sujet) mais ouvert (édition)
  • contenus réutilisables (connexion avec des réservoirs de données)

Nous reviendrons sur ce qu’est un livre numérique et de quelle façon il peut être produit, mais il est intéressant de noter que ce concept est probablement le plus abouti avec Wikipédia.

5. 4 termes dans le glossaire #

Cette étude de cas va nous permettre de prendre en considération les différentes thématiques vues aujourd’hui : la définition des humanités numériques, la question des humanités en général, ce qu’est l’informatique et par extension un ordinateur, ou encore comment peut-on définir Internet.

Humanités #

Le terme humanités est un terme polysémique, il définit à la fois les lettres classiques (la littérature grecque et latine), une formation scolaire entre le Moyen Âge jusqu’à la Révolution française, ou le champ disciplinaire des lettres et des sciences humaines et sociales. Actuellement c’est cette dernière définition qui est la plus utilisée : les humanités correspondent aujourd’hui aux sciences humaines et sociales (comprenant les lettres), parfois en opposition aux sciences de la vie et de la terre. L’influence du terme anglais « humanities » est certaine . Si une tension entre ces deux grands pans du savoir peut parfois être constatée, les humanités numériques permettent de faire un lien entre les humanités et (notamment) l’informatique.

Lien vers la fiche dans le glossaire

Numérique #

Le terme de « numérique » est un terme polysémique qui définit une représentation par nombres. Il est souvent utilisé pour regrouper à tous ce qui a trait aux nouvelles technologies, à l’informatique ou à Internet. Numérique est opposé à analogique : une information analogique est une reproduction fidèle d’une information (son, image, vidéo). Une information numérique est une représentation discrète basée sur ce que l’on appelle un échantillonnage. Le numérique offre l’avantage d’une reproductibilité sans perte d’information .

Attention à ne pas croire que ce qui est numérique est immatériel : la page web que vous lisez est hébergée sur des serveurs (des ordinateurs), et l’information est transmise par le biais de câbles et d’ordinateurs. Le numérique est donc parfaitement matériel.

Lien vers la fiche dans le glossaire

Informatique #

L’informatique est tout autant un domaine de recherche, une science du traitement rationnel, l’application de procédés techniques dans l’industrie que « l’électronique mise au service de l’information » . L’informatique se traduit parfois par l’usage des ordinateurs, mais il ne faut pas réduire la science informatique à cela. Utilisé comme un adjectif, « informatique » concerne l’utilisation des ordinateurs pour le traitement de l’information. Le terme « informatique » correspond également à la conception et la production des ordinateurs, ces machines de calcul universel. L’application de l’informatique permet l’existence des sciences de l’information et de la communication.

En informatique il faut distinguer le matériel (par exemple un ordinateur portable), le système d’exploitation (qui permet l’utilisation des composants et des logiciels), les logiciels (les applications qui fonctionnent via le système d’exploitation) et les données (utilisées par les logiciels).

Lien vers la fiche dans le glossaire

Internet #

Internet est un réseau de réseaux qui permet d’accéder à un certain nombre de services comme le Web, le courrier électronique ou le partage de fichiers . Ce réseau informatique est mondial, et il est basé sur des protocoles ouverts (décrits dans les Request For Comments) dont la commutation de paquets. Internet est pensé comme un réseau distribué ouvert , même si dans les faits il s’agit plutôt d’un réseau décentralisé sans centre névralgique. Internet est ce qui permet, dès les années 1980, de considérer une culture numérique : une diffusion large des connaissances humaines et la possibilité de créer de partager des contenus et des savoirs .

Lien vers la fiche dans le glossaire

#