La British Library commence l'archivage numérique du Web britannique

Audrey Oeillet
Publié le 05 avril 2013 à 18h07
La bibliothèque nationale du Royaume-Uni vient d'annoncer le lancement de sa « récolte » de fichiers numériques britanniques, en vue d'enregistrer et d'indexer de nombreux contenus pour les préserver pour les générations futures. Une opération de très grande envergure.

00FA000005891704-photo-british-library.jpg
« Si vous voulez un aperçu de la vie aujourd'hui au Royaume-Uni, vous devez regarder sur le Web » explique au Telegraph Lucie Burgess, qui mène le projet développé par la British Library. L'objectif de l'organisme : enregistrer des milliards de pages Web, de magazines et de livres électroniques pour les stocker au même titre que les ouvrages traditionnels, en vue de les conserver en lieu sûr.

« Nous avons déjà perdu beaucoup d'éléments, notamment concernant les attentats de Londres du 7 juillet 2005, ou la crise financière de 2008 » estime Lucie Burgess, pour qui il ne faut pas attendre pour se lancer dans la démarche de sauvegarde. « Ce matériel est tombé dans un trou noir numérique, parce que nous n'avons pas été en mesure de le récupérer ». Une perte qui inclut également les réactions sur les réseaux sociaux.

La démarche, qui sera lancée samedi, concernera 4,8 millions de domaines britanniques, qui seront « aspirés » automatiquement. Un milliard de pages Web devraient être « moissonnées » par ce biais durant les trois prochains mois : il en faudra ensuite deux de plus pour que la British Library traite les données, et supprime notamment les contenus liés à des sites étrangers, ou encore d'archiver les tweets. La pratique est légale : le Royaume-Uni la prépare depuis 2003, année de la ratification du Legal Deposit Libraries Act, qui autorise l'archivage de données numériques au titre de la préservation.

Après cette première récolte, la bibliothèque nationale du Royaume-Uni effectuera des mises à jour régulières de ses bases de données. Le projet, en développement depuis deux ans, a déjà coûté 3 millions de livres sterling à l'organisme. « La préservation et le maintien d'une trace de tout ce qui a été publié constitue une ressource inestimable pour les chercheurs d'aujourd'hui et de demain » estime le ministre de la culture britannique Ed Vaizey. Les informations récoltées seront accessibles gratuitement pour les visiteurs de plusieurs bibliothèques partenaires à travers le Royaume-Uni : à noter que la BT n'a pas expliqué comment et où elle comptait stocker les données récoltées.
Audrey Oeillet
Par Audrey Oeillet

Journaliste mais geekette avant tout, je m'intéresse aussi bien à la dernière tablette innovante qu'aux réseaux sociaux, aux offres mobiles, aux périphériques gamers ou encore aux livres électroniques, sans oublier les gadgets et autres actualités insolites liées à l'univers du hi-tech. Et comme il n'y a pas que les z'Internets dans la vie, j'aime aussi les jeux vidéo, les comics, la littérature SF, les séries télé et les chats. Et les poneys, évidemment.

Vous êtes un utilisateur de Google Actualités ou de WhatsApp ?
Suivez-nous pour ne rien rater de l'actu tech !
Commentaires (0)
Rejoignez la communauté Clubic
Rejoignez la communauté des passionnés de nouvelles technologies. Venez partager votre passion et débattre de l’actualité avec nos membres qui s’entraident et partagent leur expertise quotidiennement.
Abonnez-vous à notre newsletter !

Recevez un résumé quotidien de l'actu technologique.

Désinscrivez-vous via le lien de désinscription présent sur nos newsletters ou écrivez à : [email protected]. en savoir plus sur le traitement de données personnelles