グーグルのAIソフトウェアが「囲碁」のグランドマスターを打ち負かす、最も複雑なゲームとされる

グーグルのAIソフトウェアが世界の古代ボードゲーム「囲碁」の世界チャンピオンを打ち負かす

グーグルは人工知能（AI）のゲームにおいて新たな賭けを上げました。科学者たちは水曜日、囲碁と呼ばれる中国に起源を持つ複雑なボードゲームでプロの人間プレイヤーを打ち負かすことができるコンピュータプログラムを作成したと発表しました。このゲームは「人間が考案した最も複雑なゲームの一つ」とされ、数兆の可能な手があります。

この偉業は、IBMのスーパーコンピュータ「ディープブルー」が1997年にチェスの世界チャンピオン、ガリー・カスパロフに勝利した試合を思い起こさせます。しかし、囲碁は中国、韓国、日本などで最も人気のある戦略ボードゲームであり、チェスよりもはるかに複雑です。

「囲碁はゲームAI研究の頂点と見なされています」と、アルファ碁プログラムを開発したグーグル・ディープマインドの人工知能研究者デミス・ハサビスは述べました。「ディープブルーがカスパロフに勝った以来、AIの大きな挑戦、あるいは聖杯とでも言えるものです。」

囲碁のボードは19×19の交差する線のグリッドで構成されています。2人のプレイヤーは、白と黒の石を大きなグリッドボードに置いて、できるだけ多くの領土を囲むために交互に手を打ちます。友好的な石に触れることができる同じ色の石は生きていると言われ、逃げ道が遮断された石は死んでいると言われます。

しかし、シンプルなルールの背後には驚くべき複雑さのゲームがあります。最高のプレイヤーは生涯をかけてこのゲームを習得し、「はしご」などの手の連続を認識し、領土のための終わりのない戦いを避けるための戦略を考案し、囲碁のボードを見て瞬時にどの石が生きているか、死んでいるか、または不明かを知る驚異的な能力を発展させます。

「おそらく人間が考案した最も複雑なゲームです」と、ロンドンのグーグル・ディープマインドのコンピュータ科学者であり、研究の共著者であるデミス・ハサビスは1月26日の記者会見で述べました。「それは10の170乗の可能なボードポジションを持ち、宇宙の原子の数よりも多いです。」

この複雑さの鍵は囲碁の「分岐パターン」にあります」とハサビスは言いました。各囲碁プレイヤーは、自分のターンごとに200の手から選択するオプションがあり、チェスの1ターンあたりの20の可能な手と比較されます。さらに、ボードを見てプレイヤーがどれだけうまくやっているかを定量化する簡単な方法はありません。

囲碁ボード

最近グーグルが設定したトーナメントでは、アルゴリズム「アルファ碁」が3度のヨーロッパ囲碁チャンピオンである中国のプロファン・フイを5対0で打ち負かしました。これまでのところ、最高のコンピュータ囲碁プログラムは人間のアマチュアレベルでしかプレイしていませんでした。この発見は、機械学習アルゴリズムにとって大きな成果を示しています。

「要するに、この研究を査読付き研究として発表することで、私たちナチュアは人工知能の透明性についての議論を刺激したいと考えています」と、昨日の記者会見でシニアエディターのタンギー・シュアールは述べました。「この論文は、知性とは何かという謎の核心に触れているので、最適な機会のように思えます。」

このゲームは中国で最初にプレイされ、チェスよりもはるかに難しいとされ、人工知能にとっての優れた「大きな挑戦」と見なされてきました - それまでは。

トーナメントの結果は、ロボットが病気分析のような複雑な分野で人間と同じようにパフォーマンスを発揮できることを期待させますが、私たちが作り出す機械に賢くされることを恐れる人々を心配させるかもしれません。

ディープマインドは、3月に韓国のソウルで行われる世界チャンピオン李世乭との対決を手配しており、賞金は100万ドルです。

李世乭氏は「グーグル・ディープマインドのAIが驚くほど強力で、ますます強くなっていると聞いていますが、今回は少なくとも勝てる自信があります。」

コンピュータが勝利した場合、その開発者でありグーグル傘下のディープマインドの責任者であるデミス・ハサビスは、賞金を慈善団体に寄付すると述べました。

このタスクを達成するために、アルファ碁は2つのセットのニューラルネットワークに依存しています - 価値ネットワークは、基本的にボードポジションを見て誰が勝っているか、なぜ勝っているかを決定し、ポリシーネットワークは手を選択します。時間が経つにつれて、ポリシーネットワークは価値ネットワークをトレーニングしてゲームの進行を確認しました。

「ディープニューラル」ネットワークは、人間の専門家のゲームからの「教師あり学習」と、自分自身と対戦するゲームからの「強化学習」の組み合わせを通じてトレーニングされます。

以前の方法とは異なり、すべての可能な手の利点を力任せに計算しようとしたプログラムは、勝つ可能性の高い手のみを考慮すると研究者たちは述べており、これは優れた人間プレイヤーが使用するアプローチです。

「私たちの検索は、想像の中でゲームを何度もプレイすることによって先を見越します」と、アルファ碁を構築するのを手伝ったグーグル・ディープマインドのコンピュータ科学者であり研究の共著者であるデビッド・シルバーは記者会見で述べました。「これにより、アルファ碁の検索は以前のアプローチよりもはるかに人間らしくなります。」

コンピュータは他の囲碁プログラムに対して99.8％の勝率を達成し、トーナメントで3度のヨーロッパ囲碁チャンピオンである中国のプロファン・フイを5対0で打ち負かしました。

イギリス囲碁協会のトレジャーであり、審判を務めたトビー・マニングは「試合は完全なトーナメント条件の下で行われ、ファン・フイが機械と対戦することに不利はありませんでした。」

「グーグル・ディープマインドは、この印象的なソフトウェアを開発したことを祝福されるべきです。」

これは、コンピュータプログラムがハンデなしでプロプレイヤーを打ち負かした初めてのケースであり、この偉業は10年先のことだと考えられていました。

グーグルのAIソフトウェアが世界の古代ボードゲーム「囲碁」の世界チャンピオンを打ち負かす

新しい投稿を受信箱で受け取る