2.2. No solo existe Google

Empecemos por un pequeño detalle. Conviene tener presente que Google no es el único buscador generalista, es decir, orientado a rastrear y localizar sitios y páginas web de cualquier clase. Hay otros, como por ejemplo:

Nuevo logotipo de Bing Logotipo de Yahoo Logotipo de Starpage Logotipo de Ask
Logotipo de Bing
Imagen de PIERPAOLO ORTENZI en Wikimedia commons. Licencia CC.
Logotipo de Yahoo
Imagen de Simon en Pixabay. Licencia de Pixabay.
Logotipo de Startpage
Imagen de Surfboard Holding BV en Wikipedia. Dominio público.
Logotipo de Ask
Imagen de ask.com en Wikimedia commons. Dominio público.

Google es el buscador más conocido y utilizado, sobre todo en España. Quizá es el que más información rastrea de internet y también el que en líneas generales mejor lo hace. Pero no hay que menospreciar la capacidad de sus rivales de encontrar resultados preferibles para algunos problemas, ni las prestaciones especiales de algunos, como Exalead o StartPage.

Pedir a veces una segunda opinión, tener otros buscadores de reserva a la hora de explorar la web, es buena idea. Puede resultarnos de utilidad.

Los contenidos profundos de la web

Google y los demás buscadores generalistas no pueden rastrear toda la información que existe en la web o, mucho menos, en internet. Hay una enorme cantidad de contenidos que no están indexados por los motores de búsqueda: es lo que se conoce con varios términos: Internet profunda, web invisible, deepnet, hidden web, etc. Se trata de archivos a los que los robots de los buscadores no llegan y de los que por tanto no pueden guardar copia, ni indexar sus textos, ni facilitar resultados cuando consultas. En cierta manera, suele decirse, los buscadores sólo exploran la superficie de la red.

Las causas de que esta parte de la web no sea accesible mediante los buscadores convencionales son muy variadas: se trata de información de alguno(s) de estos tipos:

  • Generada dinámicamente en bases de datos, sin páginas ni URL estables.
  • Hospedada bajo interfaces y sistemas de búsqueda propios.
  • Disponible sólo mediante registro personal, nombre de usuario, contraseña, etc.
  • De pago, mediante suscripción, licencia, pago por uso, etc.
  • Bajo formatos o tecnologías especiales, multimedia, etc., no páginas html.
  • Restringida a los robots de los buscadores por diversas razones y métodos.

La Internet profunda incluye todo tipo de materiales. Algunos son información científica valiosa y de interés. Está alojada en bases de datos y otros archivos digitales que deben ser consultados específicamente para conseguirla, por lo que hay que conocerlos.

Por eso es importante que estés preparado para usar otras herramientas de búsqueda y nuevas fuentes de información especializada que vayas conociendo a lo largo de tu carrera y en el futuro.

Los sitios de la deep web (internet profunda) más grandes
Captura de pantalla en Wikipedia