Unidad 6 : El archivo de la Web

 

En paralelo a la aparición progresiva en Internet de servidores y páginas web, las administraciones públicas y universidades de diversos países han diseñado estrategias para garantizar el acceso y la preservación de los contenidos publicados en línea por medio de su captura y procesamiento.

 

Se están realizando acciones sistemáticas de preservación de la producción digital más obvia, las páginas web, mediante la creación de repositorios digitales llamados habitualmente “archivos web”.

El beneficio que generan estos depósitos contemporáneos es inherente a la acción de las instituciones de la memoria, bibliotecas, archivos y museos: la garantía del acceso permanente al patrimonio creado por una comunidad, para contribuir al progreso y al crecimiento individual y colectivo de sus miembros.

Existen numerosos repositorios digitales en funcionamiento destinados al archivo de las páginas web publicadas en Internet. Los más conocidos son también los que dieron los primeros pasos en 1996: el sueco Kulturarw3 y el australiano Pandora; así como un conocido repositorio de alcance internacional, Internet Archive.

 

 

En España, la Biblioteca de Catalunya inició en 2005 el proyecto PADICAT (Patrimonio Digital de Cataluña), dedicado al archivo sistemático de la Internet catalana. En 2007 el gobierno vasco y Eusko Jaurlaritzaren Informatika Elkartea (EJIE, sociedad informática de servicios al gobierno vasco) crearon Ondarenet, archivo electrónico del patrimonio digital vasco. Desde 2009 la Biblioteca Nacional de España encarga capturas periódicas del dominio .es a Internet Archive.

 

 

Por lo que afecta a la preservación digital en este tipo de repositorios digitales, las instituciones responsables son conscientes de la problemática de las estrategias más habituales de preservación, como la migración periódica o refresh de los datos (migración a nuevas versiones de los mismos programas o lenguajes, o a nuevos programas capaces de leer los anteriores), la emulación (el uso de software, especificaciones, etc., utilizado en el momento de la creación), la recreación (simulación por ingeniería inversa u otros métodos).

 

Los retos de futuro, para las comunidades que cuentan con archivos web, o que aún se hallan en una situación previa a su diseño, pasan en primer lugar por crear y consolidar estructuras tecnológicas que puedan asumir el crecimiento exponencial de este tipo de archivos. En segundo lugar, por definir las estrategias de preservación digital, como uno de los aspectos que puede acabar siendo clave en la necesaria transferencia de conocimiento a la sociedad a la que sirven. En tercer lugar, es imprescindible abordar procesos de cooperación entre archivos web e instituciones de la memoria, para dar respuesta eficiente a los retos de preservación digital y acceso a los recursos depositados.

 

Referencia bibliográfica

 

Ciro Llueca; Mari Carmen Marcos. Artículo 6.8. El archivo de la web [en linea]. En Cristòfol Rovira; Mari Carmen Marcos; Lluís Codina (dir.). Máster en Documentación Digital Barcelona: Área de Ciencias de la Documentación. Departamento de Comunicación. Universidad Pompeu Fabra, 2012. <https://www.documentaciondigital.org>.