Apologie pour l'histoire continue ou les carnets d'un médiéviste

Photo aléatoire choisie par Zid

La révolution souterraine des Digital Humanities. (1) Pour une refondation de la critique des sources.

L'apport des digital humanities aux disciplines de sciences humaines est encore largement sous-estimé. Envisagées comme outil, les technologies du numérique sont souvent envisagées avant tout comme outil, destinées à mettre en valeur, clarifier, publier, interroger les sources plus ou moins anciennes. Mais on n'a pas encore suffisamment souligné le rôle de créateur de données des technologies du numérique. Ce rôle en est d'ailleurs à ses débuts, il se décline de multiples façons, suivant une évolution des processus de création des données au fil de la construction du web. Je voudrais consacrer les prochaines notes à la description de ces différents processus.

Il convient d'abord de distinguer, de manière purement artificielle, les documents des données. Cette distinction, je ne l'ai pas inventée: elle est maîtrisée par les spécialistes du web de données. Mais je remarque qu'elle n'est pas du tout répandue chez les historiens (en tout cas ceux que je connais), qui confondent souvent document et donnée ou qui se focalisent sur le document. C'est cependant une distinction opératoire et nécessaire.

Par documents, j'entends les « sources primaires » mais aussi les « sources secondaires », tout document produit et structuré par l'homme. Le document, c'est la source de l'historien, de l'historien de l'art, de l'archéologue, créée en un temps T et découverte par le scientifique. C'est le texte ou le manuscrit du littéraire ou du linguiste. Cette première distinction est essentielle pour le chercheur : la critique documentaire, dite historique, ne s'applique qu'au document. C'est la base de son travail. Le document peut également être le travail scientifique produit et publié par le chercheur. Lui aussi peut et doit faire l'objet d’une forme de critique historique. Le document est donc une entité réelle et concrète qui délivre un message composé d'informations multiples.

Les données sont, telles que je les envisage, toute information contenue dans les documents, sous quelque forme qu'elles soient ; ce sont les « data », qui peuvent être lues humainement ou seulement mécaniquement, qui peuvent exister et être manipulées indépendamment des documents qui les contiennent, qui peuvent être produites par déduction, induction ou par imagination humaine comme mécanique. Les données sont l'état intermédiaire entre la source et la problématique du chercheur, mise en œuvre. A l'époque pré-électronique, la donnée était mise en fiches, extraite des sources/documents par les chercheurs. Une fois les bases de données apparues, le chercheur a vite (?) compris l'intérêt d'éclater le document en données, de le faire exploser en autant de fiches, de champs que le cerveau du chercheur pouvait concevoir : autant de données. La donnée existe et n'existe pas, elle peut n'exister que le temps d'un calcul de processeur et d'un affichage virtuel. C'est le produit de la ruminatio médiévale.

Par zid dans Diplomatique du web 8 décembre 2012 00:20:04
Aucun commentaire Ajouter un commentaire

Catégories

Archives

A propos