logo FranceGenWeb

Les archives de l'internet français
Attention: pour toute demande de renseignement adressez vous exclusivement au(x) contact(s) donné(s) ci-dessous, n'utilisez cette adresse que pour me signaler une erreur / groelly
(15/04/08)

Les archives de l´Internet constituées par la BnF peuvent être consultées en Bibliothèque de recherche, sur les sites F.-Mitterrand et Richelieu.

Depuis le 1er août 2006, la Bibliothèque a pour mission de collecter, conserver et communiquer les sites Internet du « domaine français » au titre du dépôt légal (loi 2006-961).À ce titre, la BnF collecte en priorité des sites :
* en .fr,
* hors .fr (.com, .org, etc.) mais dont les auteurs sont domiciliés en France ou les contenus sont produits en France.

Les collectes sont réalisées à l'aide de robots moissonneurs qui copient pages, images, animations, fichiers audio et vidéo. Les sites sont ensuite datés et indexés pour être restitués dans leur contexte de publication original, ce qui permet de naviguer dans les archives comme sur l´Internet, en cliquant de lien en lien.

Tous les sites et toutes les pages des sites ne peuvent être archivés. La BnF constitue des échantillons représentatifs de l´Internet français en combinant deux modes d´archivage :
* des collectes larges permettent de constituer des échantillons de plusieurs centaines de milliers de sites. Depuis 2004, ces collectes sont réalisées une fois par an, en partenariat avec la fondation américaine Internet Archive,
* des collectes ciblées permettent de constituer des archives plus complètes et plus fréquentes d´un nombre limité de sites repérés par des bibliothécaires travaillant dans une discipline (par exemple littérature) ou sur un thème (par exemple les élections de 2007 ou le développement durable).

En avril 2008, les archives de l´Internet de la BnF contiennent environ 13 milliards de fichiers ; certains remontent à 1996.

Plus d'infos