Reddit, IA, Archivos · 2 min read · Oct 28, 2025

Reddit Corta el Acceso a Wayback Machine para Frenar a los Scrapers de IA

Si alguna vez has confiado en Wayback Machine para encontrar una antigua publicación de Reddit o ver un hilo que ha desaparecido desde entonces, esa ventana está a punto de cerrarse.

Reddit ha anunciado que está cortando la mayor parte de su sitio del Wayback Machine de Internet Archive, afirmando que algunas empresas de inteligencia artificial (IA) han estado eludiendo silenciosamente el archivo para evitar sus restricciones de datos.

¿Qué es Internet Archive?

Internet Archive es una organización sin fines de lucro dedicada a preservar la mayor parte de la historia de internet, desde sitios web antiguos hasta libros y artefactos culturales. Su Wayback Machine permite a cualquiera ver cómo se veía una página web en un momento específico — incluso si ha sido eliminada o cambiada desde entonces. Sin embargo, Reddit dice que el archivo también ha estado guardando publicaciones que los usuarios han eliminado, una práctica que argumenta plantea preocupaciones de privacidad.

”Internet Archive proporciona un servicio a la web abierta, pero hemos sido informados de casos donde las empresas de IA violan las políticas de la plataforma, incluidas las nuestras, y extraen datos del Wayback Machine,” dijo el portavoz de Reddit, Tim Rathschmidt, en un comunicado a The Verge. “Hasta que puedan defender su sitio y cumplir con las políticas de la plataforma (por ejemplo, respetar la privacidad del usuario, respecto a eliminar contenido eliminado) estamos limitando parte de su acceso a los datos de Reddit para proteger a los redditors.”

Las nuevas restricciones ya han entrado en vigor desde ayer, y Reddit dice que notificó al Internet Archive con anticipación.

El cambio significa que el Wayback Machine ya no podrá guardar publicaciones, comentarios o perfiles de Reddit. Ahora solo podrá guardar la página de inicio de Reddit. Durante años, el archivo ha sido un recurso para periodistas, investigadores y usuarios curiosos, preservando instantáneas de las extensas conversaciones de Reddit. Ahora, funcionará más como una instantánea de los titulares de tendencias diarias en lugar de un registro histórico completo.

Este movimiento es parte de una tendencia más amplia: Reddit ha pasado años reforzando el control sobre sus datos mientras las empresas de IA se apresuran por contenido para entrenar sus modelos. Los acuerdos con Google y OpenAI han reportado millones, y Reddit ha dejado claro: si las empresas de IA quieren acceso, tendrán que pagar.

Reddit ha estado reforzando el control sobre sus datos durante años, particularmente a medida que las empresas de IA se apresuran por contenido para entrenar sus modelos. Los acuerdos con Google y OpenAI han reportado millones para la plataforma, pero Reddit ha dejado claro que si las empresas de IA quieren acceso, tienen que pagar. A principios de este año, la compañía incluso demandó a la startup de IA Anthropic, acusándola de extraer datos del sitio sin permiso.

“Tenemos una relación de larga data con Reddit y continuamos teniendo discusiones en curso sobre este asunto,” dijo Mark Graham, Director del Wayback Machine, en un comunicado a The Verge.

Mientras Reddit dice que el movimiento se trata de salvaguardar la privacidad del usuario y mantener sus reglas, los críticos temen que arriesgue borrar partes del registro histórico de internet. Una vez que una publicación desaparece de Reddit y no puede ser archivada, se pierde para siempre — llevándose consigo una parte de la cultura en línea que de otro modo podría haber sido preservada.

Share: X/Twitter LinkedIn

Recibe nuevas publicaciones en tu bandeja de entrada.

No spam. Cancela la suscripción en cualquier momento.