AI 기술 · 1 min read · Dec 12, 2025
마이크로소프트의 새로운 AI 봇이 텍스트 설명을 기반으로 그림을 생성하다

마이크로소프트의 새로운 AI 도구가 텍스트에서 아름다운 이미지를 그립니다
인공지능(AI) 기술은 지난 몇 년 동안 놀라운 발전을 이루었으며, 미래의 다음 큰 혁신으로 주목받고 있습니다.
그 방향으로 더 나아가고 있는 것은 여러 AI 관련 프로젝트에 투자하고 있는 마이크로소프트입니다. 이 기술 대기업은 두 개의 머신 러닝 모델에서 실행되는 생성적 적대 신경망(GAN)을 사용하여 “드로잉 봇”이라고 부르는 새로운 AI 도구를 만들었습니다. 이 봇은 설명적인 캡션만을 기반으로 이미지를 생성하기 위해 GAN을 사용합니다.
하나의 머신 러닝 모델은 텍스트 설명에서 이미지를 생성하고, 다른 모델인 판별자는 생성된 이미지의 진위를 판단하기 위해 텍스트 설명을 사용하여 속지 않도록 합니다. 함께 작업하면서 판별자는 생성기를 완벽으로 밀어냅니다. GAN 기법을 사용함으로써 AI는 캡션과 같은 텍스트 설명에서 이미지를 생성할 때 개별 단어에 세심한 주의를 기울여 이전의 텍스트-이미지 방법에 비해 이미지 품질이 세 배 향상됩니다.
마이크로소프트에 따르면, 이 봇은 텍스트에 구체적으로 언급되지 않은 세부 사항을 상상하며 그림을 그릴 수 있는 능력도 가지고 있어 AI가 “인공 상상력”을 포함하고 있음을 나타냅니다.
예를 들어, 아래 이미지는 “노란 몸체, 검은 날개, 짧은 부리를 가진 새”라는 설명만으로 드로잉 봇에 의해 생성되었습니다. 주어진 텍스트에는 명시되어 있지 않지만, AI는 인공 상상력을 사용하여 새를 가지에 놓기로 선택했습니다. 새뿐만 아니라, 이 AI 도구는 풀을 뜯고 있는 가축과 같은 평범한 시골 풍경부터 떠다니는 이층 버스와 같은 기괴한 것까지 무엇이든 그릴 수 있습니다.
“빙(Bing)에 가서 새를 검색하면 새 사진이 나옵니다. 하지만 여기서는 컴퓨터가 처음부터 픽셀 단위로 그림을 만듭니다.”라고 마이크로소프트 레드몬드 연구소의 딥 러닝 기술 센터에서 수석 연구원 및 연구 관리자 역할을 하는 샤오동 허(Xiaodong He)가 프로젝트에 대한 보고서에서 말했습니다. “이 새들은 실제 세계에 존재하지 않을 수 있습니다 — 그들은 단지 우리 컴퓨터의 새에 대한 상상력의 한 측면입니다.”
마이크로소프트 연구원 펑촨 장(Pengchuan Zhang)은 연구에 대해 “당신의 머신 러닝 알고리즘이 인공지능을 실행하여 이미지의 일부 누락된 부분을 상상해야 합니다. 데이터에서 머신 러닝 알고리즘은 새가 있어야 할 위치에 대한 상식을 배웁니다.”라고 말했습니다.
아직 과학적 검토를 거치지 않은 연구 보고서는 화가와 인테리어 디자이너에게 스케치 보조 역할을 할 수 있다고 마이크로소프트는 말합니다. 허 씨는 이 기술이 각본을 기반으로 애니메이션 영화를 생성할 수 있을 것으로 상상하며, 이는 애니메이션 제작자가 하는 작업을 보강하여 수작업으로 수행해야 하는 일부 노동을 없앨 것이라고 말했습니다.
새 게시물을 받은 편지함에서 받기
스팸은 없습니다. 언제든지 구독 해지 가능합니다.