L'Institut national de l'audiovisuel archive blogs et autres sites Internet relatifs à l'élection présidentielle 2007. Sont concernés « les sites et blogs actifs français, ainsi que les sous-sites et forums politiques des principaux médias », indique l'INA dans un communiqué.
Cet archivage a débuté fin janvier. Le corpus est passé de 1.400 sites en début de campagne à plus de 2.200 fin mars, et fait l'objet d'une analyse statistique et cartographique sur le site Observatoire Présidentielle 2007 de la jeune société RTGI (Réseaux, territoires & géographie de l'information). Le PS domine la 'blogopole' avec 547 sites, contre 315 pour l'UMP et 285 pour l'UDF.
« Depuis le mois d'avril, les 500 principales pages de chaque site ont été collectées jusqu'à 4 fois par jour, une collecte plus profonde étant menée tous les trois jours environ, et une collecte complète chaque mois », précise l'INA. Les pages d'accueil des sites ont été captées toutes les 15 minutes lors des élections, les 22 avril et 6 mai 2007. En moyenne, 220 versions par site auront été captées au cours de la campagne. Sur la période, 80 millions d'URL ont été collectées dont plus de 15.000 vidéos hébergées à 90% par Dailymotion. Au total, conclut l'Institut, cela représente « 700 Go de stockage compressé et dédoublonné, dont 300 Go pour les seules vidéos, dans le format de stockage DAFF développé par l'INA ».