Dentro de la antigua iglesia donde se guardan un billón de páginas web

A pocas cuadras del Presidio de San Francisco, el parque nacional situado al pie del puente Golden Gate, se alza un reluciente edificio blanco, cuya fachada está adornada con ocho llamativas columnas góticas.

Pero lo que una vez fue la sede de una iglesia de la Ciencia Cristiana, es ahora el santo grial de la historia de Internet: el Archivo de Internet, una biblioteca sin fines de lucro dirigida por un grupo de ingenieros de software y bibliotecarios, que durante casi 30 años han estado salvando la web página por página.

Dentro del santuario adornado con vidrieras, los sonidos de los sermones de la iglesia han sido reemplazados por el zumbido de los servidores, donde la Wayback Machine del Archivo de Internet conserva las páginas web.

La Wayback Machine, una herramienta utilizada por millones de personas a diario, ha demostrado ser fundamental para académicos y periodistas que buscan información histórica sobre lo que corporaciones, personas y gobiernos han publicado en línea en el pasado, mucho después de que sus sitios web hayan sido actualizados o modificados.

Para muchos, la Wayback Machine es como una historia viva de internet, y el mes pasado registró su página número un billón.

Archivar la web es más importante y complejo que nunca. En enero, la Casa Blanca ordenó la eliminación de una gran cantidad de páginas web gubernamentales . Mientras tanto, la inteligencia artificial está difuminando la línea entre lo real y lo generado artificialmente, eliminando en cierto modo la necesidad de visitar sitios web. Además, gran parte del contenido de internet se encuentra ahora tras muros de pago o integrado en conversaciones con chatbots de IA.

Es tarea del Archivo de Internet averiguar cómo preservarlo todo.

“Estamos aquí para intentar dejar constancia de lo sucedido, para que la gente pueda aprender y basarse en ello para construir un futuro mejor, o para generar nuevas ideas que merezcan estar en la biblioteca (del Archivo de Internet)”, dijo Brewster Kahle, fundador del Archivo de Internet.

La biblioteca de internet
Kahle creó el archivo en 1996, cuando las páginas guardadas durante un año cabían en unos 2 terabytes de discos duros, la capacidad de almacenamiento que ofrece hoy un iPhone. Ahora, el archivo guarda cerca de 150 terabytes, o cientos de millones de páginas web, al día.

Kahle es la fuerza motriz y la personalidad detrás del archivo, con el entusiasmo y la energía de tu profesor de ciencias favorito y la pasión de un evangelista cuya religión son las bibliotecas y la tecnología. Sentado para una entrevista en los bancos de madera originales de la iglesia, Kahle comentó que se inspiró para comprar el edificio porque se asemeja al logotipo del grupo. Pero, aún más importante, dijo que es un símbolo de permanencia y una referencia a la Biblioteca de Alejandría en Egipto.

“Esa fue la primera vez que alguien intentó recopilar todo lo que los humanos habían escrito”, dijo Kahle. “Por supuesto, ahora ese lugar es internet, y el Archivo de Internet funciona como una biblioteca para toda la red”.

La herramienta Wayback Machine hace mucho más que simplemente capturar la página. También guarda la arquitectura técnica —el código HTML, CSS, JavaScript y más— para poder intentar «reproducir la página tal como existía» incluso si el servidor ya no funciona, explicó Mark Graham, director de Wayback Machine.

El auge de la inteligencia artificial y los chatbots con IA está transformando la forma en que el Archivo de Internet registra la historia de internet. Además de páginas web, ahora el Archivo de Internet también recopila contenido generado por IA, como las respuestas de ChatGPT y los resúmenes que aparecen en la parte superior de los resultados de búsqueda de Google.

El equipo de Internet Archive, compuesto por bibliotecarios e ingenieros de software, está experimentando con formas de preservar cómo las personas obtienen sus noticias a través de chatbots, creando cientos de preguntas y sugerencias cada día basadas en las noticias, y registrando tanto las consultas como las respuestas, dijo Graham.

El grupo guarda copias de su archivo en distintas ubicaciones del mundo por si un incendio o una inundación dañaran sus servidores. Pero este enfoque también responde a consideraciones políticas. El gobierno de Trump ha ejercido presión sobre el contenido con el que no está de acuerdo, presentando demandas contra empresas de medios o a través de la Comisión Federal de Comunicaciones (FCC).

“Las bibliotecas siempre son un objetivo. A los nuevos usuarios a menudo no les gusta lo antiguo. Así que diseñemos teniendo esto en cuenta”, dijo Kahle. “Vayamos a la altura de las circunstancias y hagamos que haya diferentes puntos de vista almacenados y accesibles de forma permanente en distintos entornos”.

La administración Trump llevó a cabo una profunda renovación de los sitios web gubernamentales, que incluyó la eliminación de innumerables páginas sobre temas que abarcaban desde políticas de salud hasta los logros de los miembros de minorías en las fuerzas armadas. Fue el archivo, que ha estado guardando páginas web durante la transición de los sitios web de las administraciones presidenciales desde 2004, el que permitió a los periodistas comprender qué se había modificado.

“Este cambio fue enorme. Secciones enteras de la web dejaron de funcionar”, dijo Kahle. “(La administración) tiene un nuevo punto de vista, y por eso tenemos bibliotecas para consultar los registros”.

Las personas que preservan la web
La mayoría de los servidores del archivo se encuentran en un gran almacén a las afueras de San Francisco, aunque un conjunto de ellos se ha colocado simbólicamente en el santuario principal de la antigua iglesia. Esta ubicación es intencional, según Kahle. Al exhibir los servidores, espera que «la gente comprenda que todos formamos parte de la protección colectiva de nuestro conocimiento».

La sede es un homenaje al trabajo de los 200 miembros del personal del Internet Archive, entre los que se incluyen ingenieros, bibliotecarios y archiveros.

Los archiveros utilizan máquinas especializadas para digitalizar libros página por página, transmitiendo su trabajo en directo por YouTube para que todo el mundo pueda verlo (con música de baja fidelidad de fondo). Los tocadiscos reproducen melodías clásicas de las décadas de 1920 y 1940, y el edificio alberga todo tipo de consolas multimedia para cualquier tipo de contenido imaginable, desde microfilmes hasta CD y televisión por satélite. (El Archivo de Internet también conserva música, televisión, libros y videojuegos).

El santuario principal de la antigua iglesia también cuenta con más de 100 estatuas de un metro de altura de empleados que han trabajado allí durante al menos tres años, una referencia al famoso ejército de terracota chino de hace miles de años.

En cierto modo, el espacio captura la peculiaridad —y la comunidad— de la propia internet.

“Hay mucha gente apasionada por la causa. Se respira un ambiente ciberpunk”, dijo Annie Rauwerda, editora de Wikipedia e influencer en redes sociales, en una fiesta celebrada en la sede del Internet Archive para conmemorar el hito de alcanzar un billón de páginas. “Internet (se siente) bastante corporativo cuando lo uso mucho últimamente, pero viendo a la gente de aquí, no lo dirías”.

La sede podría parecer una especie de exposición de historia viva. Pero el objetivo del Internet Archive, según Kahle, es preservar la web para que pueda seguir teniendo futuro, no erigirse en árbitros de la verdad.

“No es una presentación. No es un museo con una historia”, dijo. “Pretende ser un recurso para que otras personas puedan generar sus propias ideas”.

Deja un comentario