Internet Archive est principalement connu pour sa Wayback Machine, une énorme archive du Web qui permet de remonter le temps et retrouver des pages parfois disparues depuis de nombreuses années. Le projet, lancé en 2001, a déjà crawlé le Web 12 fois, cumulant au passage plus de 2 pétaoctets de données couvrant 364 milliards de pages.
Dans la nuit du 5 au 6 novembre, les locaux d'Internet Archive situés à San Francisco ont été victimes d'un incendie : ce dernier n'a pas endommagé les données hébergées par le service, qui dispose d'ailleurs de plusieurs sauvegardes dans différents lieux. Néanmoins, l'organisme se charge également de numériser des documents imprimés et des microfilms, qui viennent compléter les archives du Web. C'est principalement le matériel qui permet la numérisation de ses documents physiques qui a été touché.
Sur son blog, Internet Archive explique avoir perdu près de 600 000 dollars de matériel de numérisation haut de gamme, et le bâtiment qui abritait le service va devoir être en partie reconstruit. L'organisme, qui fonctionne principalement grâce aux dons des internautes, en appelle donc à la générosité de ces derniers pour se remettre sur pied.
Internet Archive en profite également pour mettre en avant les avantages de la numérisation face à ce genre de situation : « cet épisode nous a rappelé que numérique et faire des copies sont de bonnes stratégiques pour l'accès et la préservation. Nous avons des copies des données d'Internet Archive à plusieurs endroits, et même si notre bâtiment principal avait été concerné par l'incendie, nous n'aurions pas perdu le contenu incroyable dont la collecte nous a demandé un dur travail. » Une raison supplémentaire pour que cette formidable démarche perdure.