AI技術 · 1 min read · Dec 12, 2025

マイクロソフトの新しいAIボットがテキスト説明に基づいて絵を描く

マイクロソフトの新しいAIツールがテキストから美しい画像を描く

人工知能(AI)技術はここ数年で驚くほど進化し、未来の次の大きなものとされています。

その方向にさらに進展を見せているのが、AIに関連する複数のプロジェクトに投資しているマイクロソフト社です。このテクノロジーの巨人は、2つの機械学習モデルで動作する生成的敵対ネットワーク(GAN)を使用して「描画ボット」と呼ばれる新しいAIツールを作成しました。このボットは、説明的なキャプションに基づいて画像を生成するためにGANを使用します。

1つの機械学習モデルはテキスト説明から画像を生成し、もう1つのモデルである識別器は生成された画像の真実性を判断するためにテキストの説明を使用し、騙されないようにします。協力して、識別器は生成器を完璧に近づけます。GAN技術を使用することで、AIはキャプションのようなテキスト説明から画像を生成する際に個々の単語に細心の注意を払い、以前のテキストから画像への方法と比較して画像品質を3倍向上させます。

マイクロソフトによると、このボットは描画中にテキストに具体的に記載されていない詳細を想像することもでき、AIには「人工的な想像力」が備わっていることを示しています。

例えば、以下の画像は「黄色い体、黒い翼、短いくちばしを持つ鳥」という説明から描画ボットによって作成されました。与えられたテキストには明記されていませんが、AIはその人工的な想像力を使って鳥を枝に置くことを選びました。鳥だけでなく、AIツールは放牧されている家畜のような普通の田舎の風景から、浮かぶ二階建てバスのような奇妙なものまで、何でも描くことができます。

「Bingに行って鳥を検索すると、鳥の画像が得られます。しかしここでは、画像はコンピュータによってピクセルごとにゼロから作成されます」と、ワシントン州レドモンドにあるマイクロソフトの研究所の深層学習技術センターの主任研究者で研究マネージャーのシャオドン・ハーはプロジェクトに関する報告で述べました。「これらの鳥は現実の世界には存在しないかもしれません — それらは私たちのコンピュータの鳥の想像の一側面です。」

マイクロソフトの研究者ペンチュアン・ジャンはこの研究について、「画像の欠けている部分を想像するために、人工知能を動かす機械学習アルゴリズムが必要です。データから、機械学習アルゴリズムは鳥がどこに属すべきかという常識を学びます。」と述べました。

科学的レビューをまだ受けていない研究報告は、画家やインテリアデザイナーのスケッチアシスタントとして機能する可能性があるとマイクロソフトは言います。ハー氏は、この技術が脚本に基づいてアニメーション映画を生成できると想像しており、アニメーション映画製作者が行う作業を「補完する」ことで、関与する手作業の一部を排除することができると述べています。

Share: X/Twitter LinkedIn

新しい投稿を受信箱で受け取る

スパムはありません。いつでも購読を解除できます。