Publicité
En savoir plus

Figurez-vous que Nanni Moretti a un frère. Il s’appelle Franco, Franco Moretti, et il est professeur de littérature anglaise à l’Université de Stanford aux Etats-Unis, mais surtout, il mène un travail qui s’inscrit dans un vaste courant qu’on appelle les « Digital Humanities », « les Humanités numériques », et qui consiste, pour le dire vite, à faire profiter les sciences humaines et sociales de ce que permet l’informatique, à la fois en termes de brassage de données, et de visualisation, ou même de diffusion. Et Franco Moretti applique ce principe à la littérature. Dans l’idée, ce n’est pas nouveau, dès les années 80, des chercheurs en littérature ont vu dans l’informatique un magnifique outil pour certains types de recherche (celles qui nécessitait de repérer, par exemple, des occurrences de mots), mais vous voyez bien que l’état de l’informatique contemporaine, à laquelle s’est ajouté notamment la mise en réseau des ordinateurs, offre des possibilités décuplées. Et Franco Moretti, au sein du « Stanford Litterary Lab », essaie d’exploiter au maximum ces possibilités. De manière assez radicale.

Franco Moretti a élaboré un concept qu’il a nommé « distant reading », la « lecture à distance ». C’est le titre de son dernier livre, sorti l’an dernier. L’idée, c’est de ne pas lire la littérature de près, mais de loin, de ne pas lire un texte en particulier, mais d’agréger des monceaux de données textuelles, de ne pas faire des études qualitatives, mais quantitatives, autrement dit, de traiter la littérature avec des méthodes d’analyse provenant des sciences : test d’hypothèses, modélisation informatique, fouille de données. Et Moretti est un défenseur assez acharné de sa méthode parce qu’elle seule permet, selon lui, de saisir la vraie nature de la littérature, parce qu’elle brasse vraiment large. Si vous vous intéressez par exemple à la lecture victorienne, vous ne vous limiterez pas au 200 romans canoniques mais vous pourrez prendre en compte les près de 60 000 romans parus au 19è siècle en Angleterre. Vous parcourrez tout le spectre. Vous ferez émerger la vérité de la littérature par le nombre.

Publicité

Une autre manière de faire, c’est la création de graphes pour, par exemple, détecter la présence d’intrigues cachées dans un texte. Il y a 3 ans, le New York Times faisait un compte rendu narquois d’une tentative d’appliquer la théorie des réseaux au Hamlet de Shakespeare. Les personnages deviennent des nœuds, les échanges verbaux des connections etc. et l’intrigue apparaît sous forme d’un schéma. Pour Moretti, ça permet de faire apparaître des zones de l’intrigue qu’on ne remarquait pas et de faire des expériences (par exemple, que devient Hamlet si on retire Horatio ?). La journaliste dit être parfois restée perplexe devant certains résultats de ce travail. Par exemple, Moretti définit le personnage principal d’un texte comme celui dont la distance avec l’ensemble des autres personnages est la plus courte, le centre du réseau. Et quand il applique cette définition formelle au Hamlet de Shakespeare, il tombe sur… Hamlet. Dingue.

La critique la plus dure qu’on peut adresser au travail de Moretti, c’est qu’un texte littéraire, ce n’est pas le monde physique, ça n’obéit pas aux lois de la nature. Un texte littéraire, c’est un monde artificiel, le produit d’une intelligence humaine, ça n’est pas systématique.

Mais faut-il pour autant balayer tout cela d’un revers de main ?

Prenons un autre exemple d’étude. On peut faire en sorte que les ordinateurs reconnaissent les genres littéraires. Grâce à deux programmes, l’un s’intéressant aux occurrences de mots, et l’autre aux signes grammaticaux et sémantiques, les ordinateurs ont réussi à reconnaître le genre d’une trentaine de textes qui leur ont été soumis. On pourrait dire, que ça ne sert pas à grand-chose étant donné que nous autres humains sommes aussi capables de distinguer un roman victorien d’un roman gothique. Oui, mais pas par les mêmes moyens. Un être humain va identifier le roman gothique en repérant dans le texte une certaine atmosphère, des châteaux, des revenants, par la présence de certains mots comme « tremblement », « ruine » etc. L’ordinateur ne procède pas de la même manière, ce qu’il repère c’est la présence de certains petits mots,- des articles par exemple -, de certaines structures de phrases. En gros, l’informatique montre que les genres littératures se distinguent par des critères qui opèrent à différents niveaux, qu’il y a dans les genres littéraires des aspects formels que le lecteur n’est pas capable de repérer. Ca peut paraître très normatif, mais il pourrait être intéressant de s’apercevoir que ce qui nous fait frémir dans la littérature gothique, c’est le fantôme, certes, mais que c’est aussi le fait qu’on dise « un fantôme » et non pas « le fantôme ». Ce serait beau que l’informatique permette de faire ressortir la puissance littéraire de ce qu’on ne regarde jamais, des petits éléments, des structures invisibles, des adverbes négligés, des conjonctions ignorées, dont elle seule identifie la présence et la récurrence. Car la machine n’a pas de préjugés.

Références

L'équipe