Distant Reading – Tools and Methods

a
Scuole dottorali
Workshop

Présentation
La lecture distante (distant reading), portée par le développement du numérique dans les sciences humaines, s’est imposée comme une des approches les plus prolifiques des textes littéraires. Les cartes, les graphiques et les arbres, pour reprendre les mots de Moretti (2005), nous permettent en effet de relire les œuvres les plus célèbres d’une manière inédite, ou de nous pencher sur des textes jusqu’alors oubliés. Ces études nouvelles ne reviennent cependant que trop peu sur l’acquisition des données à observer : d’où viennent-elles ? Comment sont-elles construites ?

La présente école se propose de revenir sur l’étape cruciale de l’acquisition des données, en revenant dans le détail sur leur chaîne de production. Nous commencerons par l’OCR (optical character recognition, reconnaissance optique de caractère), qui permet de transformer un jeu d’image en un texte exploitable, en dépit des difficultés introduites par la variation des systèmes graphiques ou la matérialité des artefacts anciens. Le second temps – décisif – est celui de l’encodage en XML-TEI, qui transforme le texte en base de données exploitable et permet d’ajouter un surcroît d’information au texte (auteur, genre, période). Le troisième et dernier temps est celui de l’analyse avec R, qui permet de tester des hypothèses par l’analyse et la visualisation de données.

Fortement tournée vers la pratique, cette école voudrait jeter les bases d’un premier corpus suisse multilingue (français, italien et allemand). Sa construction au cours de l’école sera l’occasion de discuter de ces enjeux.

Ce cours s’inscrit dans le cadre d’un travail collectif mené au sein du projet européen COST Distant reading pour lequel les organisateurs sont les représentants suisses.

Programme
Jour 1

9h30-10h : Accueil des participants
10h-10h30 : Introduction à la lecture distante
10h30-11h : Introduction à l’OCR
11h-11h30 : Pause-café
11h30-12h30 : TP : entraîner et utiliser un OCR
12h30-14h : repas
14h-15h30 : Introduction à la construction de corpus : balancement du corpus + TP
15h30-16h : Pause-café
16h-17h30 : Introduction à la construction de corpus : encoder son corpus + TP
18h-19h : Keynote I, The Challenges of Composing a Swiss Literature Corpus (Rosemarie Zeller, UNIBAS)

Jour 2

9h-10h : Keynote II, The Challenges of Encoding Multi-lingual Corpora (Carolin Odebrecht, Berlin HU)
10h-10h30 : Pause-café
11h-12h30 : Encodage de corpus (avancé) + TP
12h30-14h : repas
14h-16h : Encodage de corpus + TP
16h-16h30 : Pause-café
16h30-17h30 : analyse des résultats

Inscription
Les étudiant-e-s inscrit en doctorat des universités de Bâle, Berne, Fribourg, Genève, Neuchâtel et Lausanne ainsi que de l'EPFL peuvent s'inscrire à ce cours.
L'inscription se fait par envoi d'un email à alexandre.camus@unil.ch
La participation à cet événement est gratuite pour les doctorant-e-s. Les éventuels frais de déplacement et d'hébergement sont pris en charge par le programme doctoral.

Organizzato da
Programme Doctoral en Etudes numériques UNIL-EPFL

Veranstaltungsort

Bibliothèque publique et universitaire de Bâle
Schönbeinstrasse 18-20
4056 
Basel

Contatto

Alexandre Camus

Lingua/e della manifestazione
Inglese

Ulteriori informazioni sugli eventi

Informazioni sui costi

CHF 0.00
La participation à cet événement est gratuite pour les doctorant-e-s. Les éventuels frais de déplacement et d'hébergement sont pris en charge par le programme doctoral.

Inscrizione

Iscrizione tramite persona di contatto