La Biblioteca Nacional de España ha completado la segunda recolección masiva del dominio .es.
Gracias al respaldo de Red.es, entidad con la que la BNE mantiene un convenio de colaboración para este propósito, la Biblioteca ha podido reforzar y ampliar la infraestructura dedicada a la recolección del patrimonio documental en línea y, de esta manera, lanzar una recolección masiva más ambiciosa que la del año pasado.
Partiendo de una lista de dominios .es que se ha incrementado en unos 50.000 con respecto a los del año pasado (un total de 1.854.501 han sido los rastreados este año), se ha ampliado el límite de megas a recolectar por dominio (de 100 a 150), la recolección ha durado dos meses (un mes menos que el año pasado) y el total de terabytes descargados supera en casi un 45% los del año pasado.
Se han recolectado más de 655 millones de documentos de todo tipo y se han recolectado al completo más de un 88% de los dominios rastreados.
Las recolecciones masivas no pretenden ser exhaustivas ni por su alcance puede hacerse un control de calidad de todo lo recolectado. Su propósito es obtener una imagen amplia de la web española en un momento dado, que sea lo más representativa posible de toda la información que se publica en la web española. Estas se complementan con las recolecciones selectivas que la BNE lleva a cabo en colaboración con los centros de conservación de las CC.AA. sobre distintos eventos, materias específicas o contenidos de interés en el ámbito autonómico.
El proyecto de archivado web de la BNE comenzó en 2009, cuando esta contrató con la entidad sin ánimo de lucro Internet Archive la primera recolección masiva del dominio .es. La colección de la web española que conserva la BNE alcanza ya los 220 Tb de información archivada.
Próximamente, la BNE y los centros de conservación de las CC.AA. darán acceso a los usuarios a esta colección.
Para más información consultar: