martes, 5 de noviembre de 2019

La historia de cómo el error 404 creó la World Wide Web


El error 404 supuso una verdadera innovación, tanto que si él el Internet que conoces y tanto te gusta no sería posible sin él.

Es la pesadilla de todos los internautas, la versión de internet de ese sonido tan irritante que se produce cuando arañas una pizarra. Haces clic en casi cualquier enlace anterior a 2005 y prepárate para lo inevitable: "HTTP 404 Not Found".

Cualquiera que lleve ya unos años navegando por Internet está familiarizado con el error 404, es decir, la manera en la que un servidor web dice que ha llegado a un callejón sin salida. Lo que es menos conocido es que este mismo error es lo que permitió que existiera la World Wide Web en sí.

La historia del hipervínculo


Hablemos de hipervínculos. Tendemos a pensar en la gran variedad de páginas vinculadas que llamamos web como una consecuencia de la conectividad a Internet. Para decirlo de otra manera: primero llegó la red de comunicación que permite a los ordenadores intercambiar datos, y luego construimos un laberinto interconectado de documentos, vdeos de gatitos, etc. 

Pero resulta que es todo lo contrario. La idea del hipertexto, es decir, un texto con enlaces que te lleva a otro contenido, es bastante anterior a la existencia de los ordenadores.

Un dibujo conceptual de la máquina memex basada en microfilm de Vannevar Bush, sacado del artículo original de Atlantic de 1945 donde lo propuso.

La idea del hipertexto se remonta nada más y nada menos que a 1945, cuando unos de los pioneros de la tecnología, Vannevar Bush, propuso una máquina para consultar datos almacenados en microfilms a la que llamó "Memex". Bush propuso una tira a lo largo del borde del microfilm donde, según las instrucciones del usuario, la máquina podría sellar el código de dirección de un panel de film relacionado. Más tarde, si alguien veía ese mismo microfilm podría instantáneamente levantar el panel vinculado que se proyectaría en unas pantallas translucidas.  


Bush se adelantó tanto a su tiempo que sus ideas siguieron siendo sueños prácticamente irrealizables hasta la década de los 60. Con el despegue de los ordenadores, el concepto de hipertexto pronto se hizo realidad. Ted Nelson, una verdadera leyenda de la Tecnología Informática, se basó en las ideas de Bush para concebir un concepto de hipertexto tremendamente ambicioso llamado Proyecto Xanadú, aunque no llegó a fructificar hasta 1998. Sin embargo, a finales de los años 60, Nelson co-desarrolló un sistema de hipertexto menos elaborado que admitía enlaces dentro de un documento. 

Al mismo tiempo, Douglas Engelbart, uno de los pioneros en la interacción humano-ordenador, estaba trabajando en su revolucionario NLS (Sistema en línea). Entre las muchas innovadoras características de NLS estaba el hecho de que el sistema permitía a los usuarios saltar dentro de un documento usando hipervínculos. Gracias al trabajo de Nelson, Engelbart y sus sucesores, los sistemas de hipertexto ya existían a mediados de la década de 1980.

La web moderna toma forma


Estos sistemas tenían limitaciones, el mayor de ellos era que estaban limitados a ordenadores individuales. Por ejemplo, la HyperCard de Apple mantenía una base de datos de tarjetas de notas que solo podían vincularse a otras tarjetas en el mismo dispositivo. Pero con el auge de las redes de ordenadores, los enlaces de documentos en un ordenador a documentos en otro eran una extensión natural. Aun así, no fue hasta 1989 cuando Tim Berners-Lee, un contratista independiente de la Organización Europea para la Investigación Nuclear (CERN), inventó la World Wide Web. 

"La frustración fue que había mucho potencial desbloqueado", dijo Berners-Lee en 2009 durante una charla en TED recordando su creación HTTP. "En todos esos discos había documentos. Imagina que todo esto forma parte de un gran sistema de documentación virtual en el cielo, digamos, en Internet, entonces la vida sería mucho más fácil". 

Pero para que esta idea se arraigara a gran escala, faltaba algo. Ese algo fue el error 404.

Antes de que apareciera Berners-Lee, los sistemas de hipertexto generalmente se aseguraban de que cada enlace llevara a algún lado. Todos los nuevos enlaces se agregaban a una base de datos centralizada de documentos y enlaces. Si se cambiaba o se eliminaba el objetivo del enlace, la base de datos estaba obligada a actualizar el enlace.


"Imagina que todo esto forma parte de un gran sistema de documentación virtual en el cielo, digamos, en Internet, entonces la vida sería mucho más fácil."

Mantener consistentes los hipervínculos fue muy útil para el usuario. También era bastante sencillo de hacer cuando todos los datos residían en un solo ordenador o en una red pequeña. Pero en una gran red de ordenadores necesitaba una autoridad central donde se registraban todos los documentos y enlaces. No existía una base de datos que pudiera manejar la continua actualización de cada enlace en todo el mundo.

Por un tiempo, este tema recibió poca atención. La mayoría de los investigadores seguían centrados en las tarjetas de notas, las aplicaciones de ayuda y otros sistemas a pequeña escala. Algunos proyectos permitieron enlaces unidireccionales de una máquina a otra sin una autoridad central, pero asumieron que estos enlaces se mantendrían como parte del proceso de autoría de documentos cohesivos de un equipo.

Resulta que había una respuesta mucho más simple.

El nacimiento de "404 no encontrado"


A Berners-Lee se le ocurrió una forma brillante y simple de validar enlaces: no hacerlo.
En la nueva y atrevida World Wide Web, el único lugar donde residía la información sobre un enlace era en el documento que contenía el enlace. Si el documento de destino era cambiado o movido, dependía del documento de enlace actualizarse en consecuencia. O no hacer nada. 

Por supuesto, esta configuración implicaba que los enlaces pueden apuntar a datos que no existían. Por lo tanto, nació el error 404. Berners-Lee creó la noción de contenido perdido y proporcionó un código de error oficial para cuando eso ocurría. 

Probablemente estés preguntándote de donde salió el número 404? Puede sonar arbitrario, pero no lo es. Hay varias docenas de códigos de estado en el protocolo de transferencia de hipertexto de Berners-Lee, o HTTP. Los códigos que comienzan con 4 son para errores del lado del usuario, y solicitar una dirección inexistente, la parte "04", es solo una de las muchas formas en que puede equivocarse mientras navega.

En cierto modo, el 404 supuso para el hipertexto lo que supuso el cero para las matemáticas: era obvio, en cierto modo, pero formalizar y crear una notación para ello revolucionó el resto del sistema.

Con esta innovación creada por Berners-Lee, un documento de hipertexto podría vincularse a cualquier otro documento para el que tuviera una dirección. Si quieres crear un vínculo a este artículo, por ejemplo, no necesitas obtener mi permiso o coordinarte con Esquire España. Solo tienes que hacerlo. Si tuviéramos que cambiar la URL sin configurar una redirección, o si acabáramos eliminando este artículo, nos saldría un mensaje de error. 

Esa independencia fue uno de los factores clave que permitió que la web prosperara. En pocos años, el mundo quedó atrapado en un frenesí de páginas y enlaces unidireccionales. 

En cierto modo, el 404 supuso para el hipertexto lo que supuso el cero para las matemáticas: era obvio, en cierto modo, pero formalizar y crear una notación para ello revolucionó el resto del sistema. 

A pesar de su grandeza, este nuevo enfoque también conllevó algunos problemas, principalmente la proliferación de enlaces rotos. Con el tiempo, las páginas se mueven, los sitios web reemplazan su contenido e incluso hay sitios que se desconectan por completo, vaciando los enlaces que apuntan a ellos. Diversos estudios han descubierto que al menos el 50 por ciento de los enlaces publicados quedan obsoletos en un periodo que va entre los 5 a los 10 años. Como consuelo, hay mucho sitios web que han hecho creativos intentos para entretenernos con páginas de error 404 personalizadas. 

Existen técnicas para evitar los enlaces rotos, ya sea eligiendo las URL de enlace con cuidado o el método más absolutista que consiste, simplemente, en archivar todo. Pero en el caso de la web, la introducción del código 404 es un pequeño precio a pagar por un flujo interminable de noticias, conocimientos y memes de gatos.

 

 



 

No hay comentarios :

Publicar un comentario

Por favor, escribe adecuadamente y se respetuoso. Gracias.