Encontrando tesoros en la red arranca de la propuesta del mooc, que lleva su mismo nombre. Este curso fue elaborado por la Universidad Tecnológica Nacional en Miríadas X. Las entradas del blog se basa en las cuestiones a resolver para superar sus contenidos. Por tanto, la temática de este cuaderno de bitácora se centra en temas relacionados a su elocuente título.

martes, 23 de junio de 2015

Web Superficial y Web Profunda

La Web profunda es cualitativamente diferente de la Web superficial, Michael K. Bergman

Se conoce como Internet superficial a la porción de Internet que es indexada por las arañas de los motores de búsqueda. La parte que no es indexada se conoce como Internet profunda. Ambas tienen conexión a la web.

Se le conoce informalmente como Internet profunda o Internet invisible (en inglés: Deepweb, Invisible Web, Deep Web, Dark Web o Hidden Web) a una porción presumiblemente muy grande de la Internet que es difícil de rastrear o ha sido hecha casi imposible de rastrear y deliberadamente, como lo es el caso del Proyecto Tor (red del anonimato).


La Wiki de Nora Nuñez Zarate y Beatriz Molina Manzano recogen información sobre los Buscadores Web y su evaluación, este trabajo se ha realizado para la asignatura Sistemas Avanzados de  Recuperación de Información de la Licenciatura en Documentación, en la Universidad Carlos III de Madrid. 
Las autoras distinguen entre la "web visible


  • es lo que se ve en las páginas resultantes de los motores de búsqueda generales de la web. 
  • Es, también, lo que se ve en casi todos los directorios de temas. 



Y, la "web invisible" es lo que no se puede recuperar ("ver") en los resultados de búsqueda y otros links contenidos en estos tipos de herramientas.




En estrategias y mecanismos de búsqueda en la web invisible de Pilar María Moreno Jiménez en mayo incide en denominar a la web invisible o profunda a la información que no puede recuperarse con los mecanismos de búsqueda comunes y nos introduce en el término: 
El término “web invisible” fue utilizado por primera vez por la Dra. Jill Ellsworth para denominar la información que resultaba “invisible” para las maquinarias de búsqueda convencionales en la web (Ellsworth, 1995). También se la denomina “web profunda” (deep web), por oposición a la “web superficial” (surface web) cuya información puede recuperarse con los buscadores de Internet (Bergman, 2000). Un buscador es un sitio web cuyo propósito principal consiste en que el público pueda encontrar información. Estos mecanismos y el software que los apoya tratan de indizar toda la web, por lo que generan y mantienen enormes bases de datos recuperables. A pesar de su pretendida exhaustividad, se calcula que los mayores motores de búsqueda indizan sólo entre un tercio y la mitad de los documentos disponibles al público en la Red (Turner, 2003). Un estudio muy citado de Bright Planet ha estimado que la información contenida en la web invisible es aproximadamente 550 veces mayor que la de la web superficial y crece a mucha mayor velocidad (Bergman, 2000). Un estudio posterior de Cyveillance calcula que el tamaño de la web profunda es 275 veces mayor que el de la web visible (Murray, 2000, citado en Ouf, 2001). Estimaciones posteriores, en cambio, señalan que el tamaño de la web invisible es sólo entre 2 y 50 veces mayor que el de la web visible (Sherman y Price, 2001b). Las diferencias en las cifras se deben a las diferentes metodologías utilizadas por los autores. En cualquier caso, el valor de la información contenida en la llamada web profunda justifica su estudio y el de sus formas de acceso.

 Michael Bergman, es el más reconocido estudioso de la Web Profunda, quien en su artículo ‘Web Profunda: sacando a la luz un valor escondido’ (2001), 
acuñó el término haciendo referencia a la expresión ‘Internet invisible’ que había sido usada por Jill Ellsworth ya en 1994, momento en el cual se pronosticaba el boom del .com y el crecimiento exponencial de la web y la consecuencia ampliación del acceso a la información y el conocimiento
·       Breve y sencillo documental sobre la web oculta, ¿qué es?, ¿cómo se usa?, ¿cómo acceder?, ¿qué peligros hay? y mucho más. Proyecto tor, como usar el navegador y los dominios .onion


Adriana Molano, directora de contenidos de la corporación Colombia Digitalnos recuerda que lo que conocemos de la web es menos del 5% de todo el conocimiento alojado en ella.



 En Papeles de Inteligencia, Ramón Archanco ofrece una guía para principiantes de la web que no ves.
Al contrario que otras páginas web, estas bases de datos no son accesibles porque necesitan un usuario o contraseña para acceder a ellas o bien son páginas dinámicas, es decir solo sirven información y resultados cuando se rellenan una serie de variables y en ese momento se crea la tabla de datos y no antes.
Asimismo, el autor nos advierte de la confusión al identificar la Internet profunda con la Internet Oscura o Dark Internet (dark web). Afirma que es un error
La Internet oscura, web oscura o dark web, es cualquier página web que ha sido ocultada intencionalmente o reside publicada en una capa de Internet que no es accesible por medios convencionales.
Mientras que Luis Castro, experto en Internet básico, dice que a la Internet profunda también se le conoce como Internet invisible, Deepnet, Darkweb, Dark Web, Undernet y hidden Web. Por eso,  Deep Web y Dark Web son términos que se usan coloquialmente para referirse a las páginas con dicha oferta. A saber,
la oferta de contenido ilegal (como pornografía infantil, oferta de sustancias, oferta de servicios ilegales, etc.),



 Alguna imformación sobre deep web proporcionado por anonymous





·        ¿Qué es Marianas Web? - más allá de la Deep Web


Para concluir, la web superpicial es un espacio indesado, navega en el .com y se accede a la información sin un nombre y contraseña necesarios en la web profunda donde los motores de búsqueda no indesan las páginas, para entrar sus usuarios deben instalar software libre The Onion Router (TOR) y su dominios son .onion. Todo este espacio navegable nos plantea la pregunta ¿estamos desnudos en Internet?