Unidad 6 : Internet invisible: la información oculta a los motores de búsqueda

 

Cuando se busca información sobre un tema en la Red suele hacerse mediante la navegación e interrogación de directorios temáticos o consultando un motor de búsqueda generalista. La información proporcionada se denomina Web visible (visible web), Web de superficie (surface web), Web accesible (open web) o (generic web sites).

Comprende todos aquellos sitios cuya información puede ser indexada por los robots de los buscadores convencionales y recuperada mediante una consulta a sus formularios de búsqueda. Sus características principales son:

  • su información no está contenida en bases de datos

  • es de libre acceso

  • no requiere la realización de un proceso de registro para acceder a su información.

 

Mayoritariamente está formada por páginas web estáticas, es decir páginas o archivos con una URL fija y accesibles desde otro enlace.

El término Web invisible (invisible web) está compuesta por el conjunto de recursos accesibles únicamente por medio de algún tipo de pasarela o formulario Web y que los motores de búsqueda no indizan. Comprende información volátil, dinámica y en formatos especiales.

Se estima que por cada millón de páginas visibles hay otros 500 o 550 millones ocultas, contiene alrededor de unos 100.000 sitios y el 90% suele ofertar su información pública y gratuitamente.

 

 

 

Los ejemplos más comunes de web invisible son:

  • Bases de datos de literatura científica en línea que suelen contener desde referencias hasta el documento integro como libros, artículos, tesis doctorales, informes. Suelen estar realizadas con la ayuda de la indización humana mediante tesauros, clasificaciones y otros sistemas de organización de conocimientos.

  • Bases de datos de pago por contenido de editores comerciales, proporcionan principalmente contenidos a texto completo.

  • Repositorios Open Access con documentos en diferentes formatos.

  • Catálogos de editoriales, guías de teléfono, directorios, catálogos comerciales, bases de datos de patentes, hemerotecas de diarios, revistas especializadas, publicaciones y boletines oficiales, datos y gráficas del mercado financiero y monetario, exposiciones digitales, enciclopedias, ofertas de empleo, disponibilidad de alojamiento y vuelos.

  • Herramientas online: callejeros, mapas, traductores, calculadoras, diccionarios, estadísticas...

  • Archivos y depósitos de documentos, listas de distribución, news, weblogs, publicaciones personales en Internet con opiniones y comentarios acerca de cualquier tema.

 

Básicamente el principal problema del Web invisible se resume a la incapacidad de las tecnologías utilizadas por los motores de búsqueda convencionales para recoger la información en Internet.

 

La Web se ha convertido en una gran colección de documentos, un almacén multidimensional de sonidos, imágenes y formatos de archivo. Estamos asistiendo al nacimiento de la biblioteca universal.

Mientras no se desarrollen aplicaciones definitivas que lo hagan visible, habrá que seguir confiando en la capacidad y en la técnica de los profesionales de la información de seguir elaborando repertorios para la investigación en línea. Instrumentos necesarios para satisfacer las demandas y necesidades de información de los usuarios de cualquier unidad informativa e imprescindible para acceder al conocimiento en general.

 

 

Referencia bibliográfica

 

Ricardo Albiñana Bertomeu. Artículo 8.3. Internet Invisible: información oculta a los motores de búsqueda [en linea]. En Cristòfol Rovira; Mari Carmen Marcos; Lluís Codina (dir.). Máster en Documentación Digital Barcelona: Área de Ciencias de la Documentación. Departamento de Comunicación. Universidad Pompeu Fabra, 2012. <https://www.documentaciondigital.org>.