↑ AttnGAN이 새를 그리는 과정 [자료 = MS홈페이지] |
MS는 18일(현지시간) AI가 문장을 읽고 해당되는 화상을 그려내는 시스템 'AttnGAN(Attentional Generative Adversarial Network)’을 발표했다.
MS 내부에서 '드로잉봇(Drawing Bot)’으로 불려온 이 시스템은 사용자가 요구한 문장에 따라 새 화상을 만들어낸다. MS가 공개한 시연을 보면 마치 사람이 그림을 그리는 것과 유사한 과정으로 AI가 화상을 만들어냈다.
AI에게 '노란색 몸, 검은 날개, 짧은 부리가 있는 새'를 그려줄 것을 요구하자 대략적인 윤곽으로 새의 형태를 나타내기 시작했다. 문장을 다시 확인하고 노란색과 검정색으로 몸통과 날개를 순서대로 칠했다. 최종 점검을 끝내고는 '짧은 부리'라는 지시를 따르겠다는 듯 부리의 길이를 줄이고 명암을 더했다. 그리고는 마치 새의 습성을 이해하기라도 한 듯이 나무가지를 추가해 새가 앉아있는 그림 한 장을 완성했다.
이처럼 AttnGAN의 AI 기술은 요구자의 지시 중 개별 단어에 집중해 그림의 완성도를 높였다. 문장에서 단어를 분리한 뒤 이미지를 떠올려 지시된 영역에 그려넣는 방식으로 인간의 특성과 유사하다. MS에 따르면 기존 AI 화상 기술과 비교해 화질이 3배 이상 향상됐다.
샤오동 헤 MS 수석 연구원은 "지금도 검색엔진에서 '새'를 검색하면 기존 데이터베이스에 올라와 있는 조류 사진을 쉽게 얻을 수 있다"면서도 "AI는 픽셀(이미지를 구성하는 최소 단위의 점) 단위에서부터 처음부터 그려낸다"고 설명했다. 이어 "AI가 그리는 새는 현실에 존재하지 않을지도 모른다"면서 "결과물은 단지 AI가 상상하는 조류의 한 단면일 뿐"이라고 말했다.
놀라운 점은 AttnGAN이 스스로 판단해 요구받지 않은 내용도 필요에 따라 알아서 추가한다는 점이다. AI가 데이터베이스를 통해 사람처럼 스스로 학습하는 '딥러닝'을 기반으로 기본적인 상식과 상상력을 갖출 수 있었다. 새 그림에서 나뭇가지에 앉아있는 형상을 표현한 것도 인터넷에 올라와 있는 새 사진들의 대다수가 그런 형태를 띄고 있다는 것을 AI가 학습했기 때문이다. MS는 지금 수준의 AI가 평범한 전원 생활을 표현한 풍경화나 날아다니는 2층 버스와 같은 상상화도 그려낼 수 있다고 설명했다.
MS는 AttnGAN의 성능이 아직까지는 미완성 단계라고 설명했다. 그러나 정확도가 높아지면 화가, 인테리어 디자이너 등의 보조 역할을 할 수 있을 것으로 기대하고 있다. 나아가 여러 장의 연속적인 그림을 그려내는 애니메이션 작업에서도 도움이 될 것으로 보고있다.
[박대의 기자]
[ⓒ 매일경제 & mk.co.kr, 무단전재 및 재배포 금지]