La numérisation du patrimoine écrit de la Grande Guerre : Laurent Veyssière répond à nos questions

En novembre 2016, la Mission du centenaire de la Première Guerre mondiale publiait un état des lieux et proposait des perspectives au sujet de la numérisation du patrimoine écrit de la Grande Guerre.

Pour en savoir plus sur ce rapport, nous avons interrogé l’auteur de ce rapport, Laurent Veyssière, conservateur général du patrimoine et directeur général adjoint de la Mission du centenaire de la Première Guerre mondiale.

Pourquoi la France est-elle un pays leader en matière de numérisation du patrimoine écrit ?

La France, État et collectivités territoriales, s’est engagée résolument dans une politique de numérisation du patrimoine culturel dès les années 1990. En particulier, depuis une quinzaine d’années, la numérisation du patrimoine écrit a pris un essor considérable dans les bibliothèques et les services d’archives. Elle permet à la fois de protéger les collections et les fonds d’archives tout en assurant leur valorisation par une consultation aisée et à distance. Les politiques de numérisation du patrimoine écrit ont beaucoup évolué au fil de ces dernières années, répondant à des enjeux différents entre bibliothèques et services d’archives, mais aussi à des ambitions diverses. La mise en ligne des documents numérisés contribue incontestablement avec succès à la démocratisation culturelle et au développement de nouvelles pratiques des internautes. Le schéma numérique de la Bibliothèque nationale de France (BnF) publié en mars 2016 rappelle à juste titre que « la numérisation est devenue en peu de temps le principal levier d’accessibilité aux documents patrimoniaux. » La France est aujourd’hui un pays leader en matière de numérisation, eu égard au volume de documents numérisés et au nombre de consultations. Lors du Conseil supérieur des archives du 3 mai 2016, la ministre de la Culture et de la Communication, Audrey Azoulay, a annoncé que 400 millions de documents conservés dans les services publics d’archives étaient en ligne et que 2,5 milliards de pages ont été consultées en 2015. De son côté, Gallica, la bibliothèque numérique de la BnF, qui célèbre son vingtième anniversaire en 2017, offre 3,7 millions de documents aux internautes. Les statistiques de consultation font apparaître un nombre de visites estimé à 16 millions en 2015. Mieux, le nombre de pages par visite s’élève à 21,1 et le temps moyen d’une visite frise le quart d’heure avec 13 minutes et 46 secondes !

Existera-t-il un jour un recensement fiable des fonds et collections numérisées de la Grande Guerre au niveau national ?

C’est incontestablement ce vers quoi il faut tendre ! Malgré l’absence de plan de numérisation national concernant les sources de la Première Guerre mondiale, force est de constater que l’offre numérique en ligne est particulièrement riche. La liberté dont ont disposé les établissements patrimoniaux pour numériser et diffuser sur leurs sites les sources de la Grande Guerre a aujourd’hui pour conséquence une très importante dispersion de l’offre. Près de 200 sites Internet français proposent des sources numérisées ! Il s’agit là d’une offre considérable qui dénote un investissement humain et financier important, mais malheureusement invisible dans sa globalité pour les Français qui n’arrivent pas identifier tous ces sites. Pour pallier cette dispersion, il est indispensable que les acteurs publics rendent compréhensible le paysage numérique pour nos compatriotes. En l’espèce, plutôt que de créer un site ou un portail de plus et donc d’ajouter un peu plus de désordre, il serait souhaitable de profiter de la création en cours du portail national francearchives.fr pour proposer une entrée structurée, éditorialisée et surtout pédagogique au patrimoine écrit de la Grande Guerre. L’expérience montre que c’est un véritable mode d’emploi en ligne, assorti de fiches pratiques comportant les liens précis avec une mise à jour constante des ressources, dont ont besoin les Français. Ce plan d’orientation devra intégrer toutes les possibilités du web sémantique.

Numérisation et indexation vont-elles de pair ?

Impossible de répondre à cette question par oui ou par non. Tout dépend du document numérisé et des informations qu’il contient, mais aussi du mode d’indexation utilisé. De manière générale, les documents nominatifs sont les premiers à nécessiter absolument une indexation fine, permettant aux internautes, en particulier les moins expérimentés, de faire une recherche simple à partir d’un patronyme. Pour les poilus de la Grande Guerre, c’est l’enjeu du Grand Mémorial que de permettre l’interrogation simultanée de la centaine de bases proposant en ligne des registres matricules. L’indexation permet à la fois à un très large public d’effectuer des recherches généalogiques et familiales, d’élargir les recherches à des groupes de combattants (habitant la même commune, le même département, exerçant le même métier), et d’effectuer des recherches sociologiques, démographiques, statistiques. Les documents collectifs peuvent également être avantageusement indexés : par exemple, la base des journaux des unités de la Grande Guerre en ligne sur Mémoire des hommes a été indexée de manière chrono-thématique. Il est possible de mener une recherche par nom d’armée ou d’unité, par nom de bâtiment, par type de navire (chalutier, croiseur, sous-marin, etc.), par escadrille, etc. L’indexation est donc très souvent une facilité accordée à l’internaute.

En quoi le crowdsourcing constitue-t-il un mode novateur d’utilisation et d’enrichissement des sources numérisées ?

De manière générale, on assiste ces dernières années à un profond bouleversement des modalités de consultation des archives et des livres. L’étude des publics menée par le Service interministériel des Archives de France montre que « dans les archives départementales, on compte aujourd’hui 1 lecteur inscrit en salle pour 7 participants aux activités culturelles (scolaires compris) et 100 internautes (visiteurs uniques) ». Parmi les internautes consultant les sites Internet des services d’archives nationales, départementales et municipales, un quart déclare participer à l’enrichissement des contenus et 20% demandent le développement des services web, en particulier les possibilités de participation collaborative et de partage. Pour répondre à ce souhait, de nombreux sites d’archives ont développé ces dernières années des outils permettant aux internautes d’annoter ou de transcrire les documents numérisés. Ce phénomène est une des caractéristiques de ce que l’on nomme le « web 2.0 » ou « web collaboratif ». Reposant sur l’intelligence collective, le web est censé bénéficier d’une valeur ajoutée grâce aux internautes. C’est aussi ce que l’on appelle le crowdsourcing, traduit en français par « production participative ». Cela va d’une cogestion d’un blog ou d’une encyclopédie en ligne (Wikipédia) par les internautes à leur participation à un projet initié par un service public, comme c’est le cas pour le monde culturel. Ces dispositifs permettent tout à la fois aux internautes d’être des créateurs de données numériques et des acteurs de l’enrichissement du patrimoine, et, le cas échéant, à l’administration de trouver une solution vertueuse aux contraintes budgétaires (c’est le cas pour les services d’archives qui souhaiteraient externaliser de vastes campagnes d’indexation fort coûteuses). Par exemple, le site du ministère de la Défense Mémoire des hommes verra sa base des 1,325 million de soldats « Morts pour la France » intégralement indexée en moins de cinq ans grâce aux internautes.

Pour en savoir plus :

Laurent Veyssière, La numérisation du patrimoine écrit de la Grande Guerre. État des lieux et perspectives, Mission du centenaire 14-18, novembre 2016.

En avril 2015, les Rencontres du web 14-18, organisées par la Mission du Centenaire, avaient contribué à montrer combien ces fonds et collections désormais accessibles en ligne avaient transformé les pratiques. Afin d’échanger de nouveau sur la manière dont la Grande Guerre est traitée sur le web, la Mission du Centenaire organise une nouvelle journée de Rencontres du Web à Paris le 17 mars 2017.

Soyez le premier à commenter

Laisser un commentaire