Интернет, Reddit · 2 min read · Oct 28, 2025

Reddit отключает Wayback Machine, чтобы предотвратить сбор данных ИИ

Если вы когда-либо полагались на Wayback Machine, чтобы найти старый пост на Reddit или увидеть тему, которая с тех пор исчезла, это окно вот-вот закроется.

Reddit объявил, что он отключает большую часть своего сайта от Wayback Machine Интернет-архива, утверждая, что некоторые компании искусственного интеллекта (ИИ) тихо обошли архив, чтобы обойти его ограничения на данные.

Что такое Интернет-архив?

Интернет-архив — это некоммерческая организация, посвященная сохранению как можно большего количества истории интернета, от старых веб-сайтов до книг и культурных артефактов. Его Wayback Machine позволяет любому увидеть, как выглядела веб-страница в определенный момент времени — даже если она была удалена или изменена с тех пор. Однако Reddit утверждает, что архив также сохранял посты, которые пользователи удалили, что, по его мнению, вызывает проблемы с конфиденциальностью.

”Интернет-архив предоставляет услугу для открытого веба, но мы были проинформированы о случаях, когда компании ИИ нарушают правила платформы, включая наши, и собирают данные из Wayback Machine,” — сказал представитель Reddit Тим Ратшмидт в заявлении для The Verge. “Пока они не смогут защитить свой сайт и соблюдать правила платформы (например, уважать конфиденциальность пользователей, касательно удаления удаленного контента), мы ограничиваем их доступ к данным Reddit, чтобы защитить реддиторов.”

Новые ограничения уже вступили в силу с вчерашнего дня, и Reddit сообщил, что заранее уведомил Интернет-архив.

Это изменение означает, что Wayback Machine больше не сможет сохранять посты, комментарии или профили Reddit. Теперь она сможет сохранять только главную страницу Reddit. На протяжении многих лет архив был основным источником для журналистов, исследователей и любопытных пользователей, сохраняя снимки обширных обсуждений Reddit. Теперь он будет функционировать больше как снимок ежедневных трендовых заголовков, а не как полная историческая запись.

Этот шаг является частью более широкой тенденции: Reddit на протяжении многих лет ужесточает контроль над своими данными, поскольку компании ИИ стремятся к контенту для обучения своих моделей. Сообщается, что сделки с Google и OpenAI принесли миллионы, и Reddit ясно дал понять — если компаниям ИИ нужен доступ, им придется заплатить.

Reddit на протяжении многих лет ужесточает контроль над своими данными, особенно поскольку компании ИИ стремятся к контенту для обучения своих моделей. Сообщается, что сделки с Google и OpenAI принесли миллионы для платформы, но Reddit ясно дал понять, что если компаниям ИИ нужен доступ, им придется заплатить. Ранее в этом году компания даже подала в суд на стартап ИИ Anthropic, обвиняя его в сборе данных с сайта без разрешения.

“У нас давние отношения с Reddit, и мы продолжаем вести обсуждения по этому вопросу,” — сказал Марк Грэм, директор Wayback Machine, в заявлении для The Verge.

Хотя Reddit утверждает, что этот шаг направлен на защиту конфиденциальности пользователей и соблюдение своих правил, критики беспокоятся, что это рискует стереть части исторической записи интернета. Как только пост исчезает с Reddit и не может быть заархивирован, он исчезает навсегда — унося с собой часть онлайн-культуры, которая в противном случае могла бы быть сохранена.

Share: X/Twitter LinkedIn

Get new posts in your inbox

No spam. Unsubscribe anytime.