Intelligence Artificielle · 2 min read · Dec 06, 2025
Une IA apprend à prédire le comportement humain en regardant 600 heures de télévision, YouTube

Des scientifiques ont alimenté un ordinateur avec des émissions de télévision pour prédire ce que les humains feront ensuite
Le laboratoire d’informatique et d’intelligence artificielle du MIT a créé un algorithme qui utilise l’apprentissage profond, permettant à l’intelligence artificielle (IA) d’anticiper les interactions plus précisément que jamais.
Les chercheurs ont développé un logiciel de vision prédictive qui utilise l’apprentissage automatique pour anticiper quelles actions devraient suivre un ensemble donné de cadres vidéo. Ils ont alimenté le programme avec 600 heures de vidéos provenant de YouTube et d’émissions de télévision populaires telles que Big Bang Theory, The Office et Desperate Housewives pour tester et voir s’il peut prédire si deux personnes vont se serrer la main, se taper dans la main, s’embrasser ou s’enlacer.
Dans une deuxième situation, l’algorithme peut anticiper ce qui pourrait apparaître dans une vidéo après cinq secondes. Il recherche des motifs et des objets reconnaissables tels que des visages humains, des mains et bien d’autres.
Bien que les salutations humaines puissent sembler comme des actions arbitraires à prédire, la tâche a servi de cas de test plus facilement contrôlable pour les chercheurs à étudier.
« Les humains apprennent automatiquement à anticiper les actions par l’expérience, ce qui nous a intéressés à essayer d’inculquer aux ordinateurs le même type de bon sens », a déclaré Carl Vondrick, doctorant au laboratoire d’informatique et d’intelligence artificielle du MIT (CSAIL).
« Nous voulions juste utiliser des vidéos aléatoires de YouTube », a déclaré Vondrick. « La raison pour laquelle nous utilisons la télévision est qu’il est facile pour nous d’accéder à ces données, et c’est quelque peu réaliste en termes de description de situations quotidiennes. »
Ils ont montré à l’ordinateur des vidéos de personnes à une seconde de faire l’une de ces quatre actions : s’enlacer, s’embrasser, se taper dans la main et se serrer la main. L’IA a pu deviner correctement 43 % du temps, ce qui se compare aux algorithmes existants qui ne pouvaient le faire que 36 % du temps.
Il convient de noter que même les humains font des erreurs dans ces tâches. Par exemple, les sujets humains n’ont pu prédire correctement l’action que 71 % du temps, ont déclaré les chercheurs.
Bien qu’il faudra encore longtemps avant que l’algorithme soit mis en pratique, les chercheurs affirment que des versions futures et plus sophistiquées pourraient être appliquées dans différents domaines. Les systèmes informatiques qui prédisent des actions ouvriraient de nouvelles possibilités allant des robots capables de mieux naviguer dans des environnements humains, aux systèmes de réponse d’urgence qui prédisent les chutes, en passant par des casques de réalité virtuelle qui vous donnent des suggestions sur ce qu’il faut faire dans différentes situations.
Regardez la vidéo ci-dessous pour voir comment l’algorithme fonctionne.
Source
Recevez de nouveaux articles dans votre boîte de réception.
Aucun spam. Désabonnez-vous à tout moment.