Dès la fin 2006 l’Ina s’est mis en situation de créer une archive large et actualisée de l’image de la campagne présidentielle sur le Web. En s’appuyant sur les travaux de la société Réseaux, Territoires & Géographie de l’Information (RTGI) l’Institut national de l’audiovisuel a défini le périmètre du corpus des sites et blogs relatifs aux élections présidentielles. Ce corpus intègre les sites et blogs actifs, ainsi que les sous-sites et forums politiques des principaux médias. Il est passé de 1 400 sites en début de campagne à plus de 2 200 depuis la mi-mars. 80 millions d’URL ont été collectées au cours de la campagne, dont plus de 15 000 vidéos hébergées pour près de 90% d’entre elles par Dailymotion. L’opération de collecte des sites a commencé le 26 janvier.