AIが600時間のテレビとYouTubeを見て人間の行動を予測することを学ぶ

科学者たちはコンピュータにテレビ番組を与えて人間が次に何をするかを予測する

MITのコンピュータサイエンスおよび人工知能研究所は、人工知能（AI）がこれまで以上に正確に相互作用を予測できるようにする深層学習を利用したアルゴリズムを作成しました。

研究者たちは、与えられた一連のビデオフレームに続くべき行動を予測するために機械学習を使用する予測視覚ソフトウェアを開発しました。彼らはプログラムにYouTubeや「ビッグバン★セオリー」、「ザ・オフィス」、「デスパレートな妻たち」などの人気テレビ番組からの600時間のビデオを与え、2人が握手するか、ハイタッチするか、キスするか、抱きしめるかを予測できるかどうかをテストしました。

2つ目の状況では、アルゴリズムは5秒後にビデオに何が現れるかを予測できます。人間の顔、手、その他多くの認識可能なオブジェクトやパターンを探します。

人間の挨拶は予測するには恣意的な行動のように見えるかもしれませんが、このタスクは研究者が研究するためのより制御可能なテストケースとして機能しました。

「人間は経験を通じて自動的に行動を予測することを学びます。これが私たちがコンピュータに同じような常識を持たせることに興味を持った理由です」とMITのコンピュータサイエンスおよび人工知能研究所（CSAIL）の博士課程の学生カール・ボンドリックは述べました。

「私たちはYouTubeのランダムなビデオを使用したかっただけです」とボンドリックは言いました。「テレビを選んだ理由は、そのデータにアクセスしやすく、日常の状況を描写する上である程度現実的だからです。」

彼らは、これらの4つの行動（抱きしめる、キスする、ハイタッチする、握手する）を行う1秒前の人々のビデオをコンピュータに見せました。AIは43%の確率で正しく推測することができ、既存のアルゴリズムは36%の確率でしかできませんでした。

このタスクでは人間も間違いを犯すことに注意する価値があります。例えば、研究者によれば、人間の被験者は71%の確率でしか行動を正しく予測できませんでした。

アルゴリズムが実用化されるまでには長い時間がかかるでしょうが、研究者たちは将来のより洗練されたバージョンがさまざまな分野で適用される可能性があると述べています。行動を予測するコンピュータシステムは、人間の環境をより良くナビゲートできるロボットから、転倒を予測する緊急対応システム、さまざまな状況で何をすべきかの提案を提供するバーチャルリアリティヘッドセットまで、新しい可能性を開くでしょう。

以下のビデオを見て、アルゴリズムがどのように機能するかを確認してください。

出典

科学者たちはコンピュータにテレビ番組を与えて人間が次に何をするかを予測する

新しい投稿を受信箱で受け取る