« Si vous voulez un aperçu de la vie aujourd'hui au Royaume-Uni, vous devez regarder sur le Web » explique au Telegraph Lucie Burgess, qui mène le projet développé par la British Library. L'objectif de l'organisme : enregistrer des milliards de pages Web, de magazines et de livres électroniques pour les stocker au même titre que les ouvrages traditionnels, en vue de les conserver en lieu sûr.
« Nous avons déjà perdu beaucoup d'éléments, notamment concernant les attentats de Londres du 7 juillet 2005, ou la crise financière de 2008 » estime Lucie Burgess, pour qui il ne faut pas attendre pour se lancer dans la démarche de sauvegarde. « Ce matériel est tombé dans un trou noir numérique, parce que nous n'avons pas été en mesure de le récupérer ». Une perte qui inclut également les réactions sur les réseaux sociaux.
La démarche, qui sera lancée samedi, concernera 4,8 millions de domaines britanniques, qui seront « aspirés » automatiquement. Un milliard de pages Web devraient être « moissonnées » par ce biais durant les trois prochains mois : il en faudra ensuite deux de plus pour que la British Library traite les données, et supprime notamment les contenus liés à des sites étrangers, ou encore d'archiver les tweets. La pratique est légale : le Royaume-Uni la prépare depuis 2003, année de la ratification du Legal Deposit Libraries Act, qui autorise l'archivage de données numériques au titre de la préservation.
Après cette première récolte, la bibliothèque nationale du Royaume-Uni effectuera des mises à jour régulières de ses bases de données. Le projet, en développement depuis deux ans, a déjà coûté 3 millions de livres sterling à l'organisme. « La préservation et le maintien d'une trace de tout ce qui a été publié constitue une ressource inestimable pour les chercheurs d'aujourd'hui et de demain » estime le ministre de la culture britannique Ed Vaizey. Les informations récoltées seront accessibles gratuitement pour les visiteurs de plusieurs bibliothèques partenaires à travers le Royaume-Uni : à noter que la BT n'a pas expliqué comment et où elle comptait stocker les données récoltées.