Искусственный интеллект · 1 min read · Dec 06, 2025

ИИ учится предсказывать поведение человека, наблюдая 600 часов телевидения и YouTube

Ученые обучили компьютер с помощью телешоу, чтобы предсказать, что люди сделают дальше

Лаборатория компьютерных наук и искусственного интеллекта MIT создала алгоритм, который использует глубокое обучение, позволяющее искусственному интеллекту (ИИ) предсказывать взаимодействия более точно, чем когда-либо.

Исследователи разработали программное обеспечение для предсказательной визуализации, которое использует машинное обучение для предсказания, какие действия должны следовать за заданным набором видеокадров. Они загрузили в программу 600 часов видео с YouTube и популярных телешоу, таких как Теория большого взрыва, Офис и Отчаянные домохозяйки, чтобы протестировать, сможет ли она предсказать, пожмут ли два человека руки, хлопнут друг другу по плечу, поцелуются или обнимутся.

В другой ситуации алгоритм может предсказать, что может появиться в видео через пять секунд. Он ищет паттерны и узнаваемые объекты, такие как человеческие лица, руки и многие другие.

Хотя человеческие приветствия могут показаться произвольными действиями для предсказания, эта задача служила более контролируемым тестовым случаем для изучения исследователями.

«Люди автоматически учатся предсказывать действия через опыт, что и привлекло наше внимание к попытке наделить компьютеры таким же здравым смыслом», — сказал Карл Вондрик, аспирант Лаборатории компьютерных наук и искусственного интеллекта MIT (CSAIL).

«Мы просто хотели использовать случайные видео с YouTube», — сказал Вондрик. «Причина, по которой мы выбрали телевидение, заключается в том, что нам легко получить доступ к этим данным, и это довольно реалистично с точки зрения описания повседневных ситуаций.»

Они показывали компьютеру видео людей, которые находятся в одной секунде от выполнения одного из этих четырех действий: обнимания, поцелуя, хлопка по плечу и рукопожатия. ИИ смог угадать правильно 43% времени, что по сравнению с существующими алгоритмами, которые могли делать это только 36% времени.

Стоит отметить, что даже люди совершают ошибки в этих задачах. Например, человеческие испытуемые смогли правильно предсказать действие только 71% времени, сообщили исследователи.

Хотя пройдет много времени, прежде чем алгоритм будет применен на практике, исследователи говорят, что будущие и более сложные версии могут быть применены в различных областях. Компьютерные системы, предсказывающие действия, откроют новые возможности, начиная от роботов, которые могут лучше ориентироваться в человеческих средах, до систем экстренного реагирования, которые предсказывают падения, и заканчивая гарнитурами виртуальной реальности, которые предлагают вам советы о том, что делать в различных ситуациях.

Смотрите видео ниже, чтобы увидеть, как работает алгоритм.

Источник

Share: X/Twitter LinkedIn

Get new posts in your inbox

No spam. Unsubscribe anytime.