Reddit, IA · 2 min read · Oct 28, 2025

Reddit corta acesso ao Wayback Machine para impedir raspadores de IA

Se você já contou com o Wayback Machine para encontrar um antigo post no Reddit ou ver um tópico que desde então desapareceu, essa janela está prestes a se fechar.

O Reddit anunciou que está cortando a maior parte de seu site do Wayback Machine do Internet Archive, alegando que algumas empresas de inteligência artificial (IA) têm se infiltrado silenciosamente no arquivo para contornar suas restrições de dados.

O que é o Internet Archive?

O Internet Archive é uma organização sem fins lucrativos dedicada a preservar o máximo da história da internet, desde sites antigos até livros e artefatos culturais. Seu Wayback Machine permite que qualquer pessoa veja como uma página da web parecia em um momento específico — mesmo que tenha sido deletada ou alterada desde então. No entanto, o Reddit afirma que o arquivo também tem mantido posts que os usuários removeram, uma prática que argumenta levantar preocupações de privacidade.

”O Internet Archive fornece um serviço para a web aberta, mas fomos informados sobre casos em que empresas de IA violam as políticas da plataforma, incluindo as nossas, e raspam dados do Wayback Machine,” disse o porta-voz do Reddit, Tim Rathschmidt, em um comunicado ao The Verge. “Até que eles consigam defender seu site e cumprir as políticas da plataforma (por exemplo, respeitar a privacidade do usuário, re: deletar conteúdo removido), estamos limitando parte do acesso deles aos dados do Reddit para proteger os redditors.”

As novas restrições já estão em vigor desde ontem, com o Reddit afirmando que notificou o Internet Archive com antecedência.

A mudança significa que o Wayback Machine não poderá mais salvar posts, comentários ou perfis do Reddit. Agora, ele poderá salvar apenas a página inicial do Reddit. Durante anos, o arquivo tem sido uma referência para jornalistas, pesquisadores e usuários curiosos, preservando instantâneas das vastas conversas do Reddit. Agora, funcionará mais como uma instantânea das manchetes diárias em tendência do que como um registro histórico completo.

Essa medida faz parte de uma tendência maior: o Reddit passou anos apertando o controle sobre seus dados enquanto empresas de IA se apressam por conteúdo para treinar seus modelos. Negócios com o Google e OpenAI supostamente trouxeram milhões, e o Reddit deixou claro — se as empresas de IA quiserem acesso, terão que pagar.

O Reddit tem apertado o controle sobre seus dados há anos, especialmente à medida que as empresas de IA se apressam por conteúdo para treinar seus modelos. Negócios com o Google e OpenAI supostamente trouxeram milhões para a plataforma, mas o Reddit deixou claro que se as empresas de IA quiserem acesso, terão que pagar. No início deste ano, a empresa até processou a startup de IA Anthropic, acusando-a de raspar o site sem permissão.

“Temos um relacionamento de longa data com o Reddit e continuamos a ter discussões em andamento sobre este assunto,” disse Mark Graham, Diretor do Wayback Machine, em um comunicado ao The Verge.

Enquanto o Reddit afirma que a medida é sobre proteger a privacidade do usuário e manter suas regras, críticos temem que isso arrisque apagar partes do registro histórico da internet. Uma vez que um post desaparece do Reddit e não pode ser arquivado, ele se foi para sempre — levando consigo uma parte da cultura online que poderia ter sido preservada.

Share: X/Twitter LinkedIn

Receba novas postagens na sua caixa de entrada

Sem spam. Cancele a assinatura a qualquer momento.