La Web profunda es cualitativamente diferente de la Web
superficial, Michael K. Bergman
Se conoce como Internet superficial a la porción de Internet
que es indexada por las arañas de los motores de búsqueda. La parte que no es
indexada se conoce como Internet profunda. Ambas tienen conexión a la web.
Se le conoce informalmente como Internet profunda o Internet
invisible (en inglés: Deepweb, Invisible Web, Deep Web, Dark Web o Hidden Web)
a una porción presumiblemente muy grande de la Internet que es difícil de
rastrear o ha sido hecha casi imposible de rastrear y deliberadamente, como lo
es el caso del Proyecto Tor (red del anonimato).
La
Wiki de Nora Nuñez Zarate y Beatriz Molina Manzano recogen información sobre los
Buscadores Web y su evaluación, este trabajo se ha realizado para la asignatura
Sistemas Avanzados de Recuperación de
Información de la Licenciatura en Documentación, en la Universidad Carlos III
de Madrid.
- es lo que se ve en las páginas resultantes de los motores de
búsqueda generales de la web.
- Es, también, lo que se ve en casi todos los
directorios de temas.
Y, la "web invisible" es lo que no se puede recuperar ("ver") en los resultados de búsqueda y otros links contenidos en estos tipos de herramientas.
En estrategias y mecanismos de búsqueda en la web invisible de Pilar María Moreno Jiménez en mayo incide en
denominar a la web invisible o profunda a la información que no puede
recuperarse con los mecanismos de búsqueda comunes y nos introduce en el
término:
El término “web invisible” fue utilizado por primera vez por la Dra. Jill Ellsworth para denominar la información que resultaba “invisible” para las maquinarias de búsqueda convencionales en la web (Ellsworth, 1995). También se la denomina “web profunda” (deep web), por oposición a la “web superficial” (surface web) cuya información puede recuperarse con los buscadores de Internet (Bergman, 2000). Un buscador es un sitio web cuyo propósito principal consiste en que el público pueda encontrar información. Estos mecanismos y el software que los apoya tratan de indizar toda la web, por lo que generan y mantienen enormes bases de datos recuperables. A pesar de su pretendida exhaustividad, se calcula que los mayores motores de búsqueda indizan sólo entre un tercio y la mitad de los documentos disponibles al público en la Red (Turner, 2003). Un estudio muy citado de Bright Planet ha estimado que la información contenida en la web invisible es aproximadamente 550 veces mayor que la de la web superficial y crece a mucha mayor velocidad (Bergman, 2000). Un estudio posterior de Cyveillance calcula que el tamaño de la web profunda es 275 veces mayor que el de la web visible (Murray, 2000, citado en Ouf, 2001). Estimaciones posteriores, en cambio, señalan que el tamaño de la web invisible es sólo entre 2 y 50 veces mayor que el de la web visible (Sherman y Price, 2001b). Las diferencias en las cifras se deben a las diferentes metodologías utilizadas por los autores. En cualquier caso, el valor de la información contenida en la llamada web profunda justifica su estudio y el de sus formas de acceso.
Michael Bergman, es el más reconocido estudioso de la Web
Profunda, quien en su artículo ‘Web Profunda: sacando a la luz un valor escondido’ (2001),
acuñó el término haciendo referencia a la expresión ‘Internet invisible’ que había sido usada por Jill Ellsworth ya en 1994, momento en el cual se pronosticaba el boom del .com y el crecimiento exponencial de la web y la consecuencia ampliación del acceso a la información y el conocimiento
· Breve y sencillo documental sobre la web oculta, ¿qué es?, ¿cómo se usa?, ¿cómo acceder?, ¿qué peligros hay? y mucho más. Proyecto tor,
como usar el navegador y los dominios .onion
Adriana Molano, directora de contenidos de la corporación Colombia Digital, nos recuerda que lo que conocemos de la web es menos del 5% de todo el
conocimiento alojado en ella.
En Papeles de Inteligencia, Ramón Archanco ofrece una guía para principiantes de la web que no ves.
Al contrario que otras páginas web, estas bases de datos no son accesibles porque necesitan un usuario o contraseña para acceder a ellas o bien son páginas dinámicas, es decir solo sirven información y resultados cuando se rellenan una serie de variables y en ese momento se crea la tabla de datos y no antes.
Asimismo, el autor nos advierte de la confusión al identificar la
Internet profunda con la Internet Oscura o Dark Internet (dark web). Afirma que es un error.
La Internet oscura, web oscura o dark web, es cualquier página web que ha sido ocultada intencionalmente o reside publicada en una capa de Internet que no es accesible por medios convencionales.
Mientras que Luis
Castro, experto en Internet básico, dice que a la Internet profunda también se le conoce como Internet
invisible, Deepnet, Darkweb, Dark Web, Undernet y hidden Web. Por eso, Deep Web y Dark Web son términos que se usan coloquialmente
para referirse a las páginas con dicha oferta. A saber,
la oferta de contenido ilegal (como pornografía infantil, oferta de sustancias, oferta de servicios ilegales, etc.),
Alguna imformación sobre deep web proporcionado por anonymous
·
¿Qué es Marianas Web? - más allá de la Deep Web
Para concluir, la web superpicial es un espacio indesado, navega en el .com y se accede a la información sin un nombre y contraseña necesarios en la web profunda donde los motores de búsqueda no indesan las páginas, para entrar sus usuarios deben instalar software libre The Onion Router (TOR) y su dominios son .onion. Todo este espacio navegable nos plantea la pregunta ¿estamos desnudos en Internet?