• 검색

메타가 '영상 만드는 AI' 개발한 이유 

  • 2022.10.07(금) 10:48

이미지 이어 영상 생성 모델 공개
메타버스·NFT 등 접목 전망 높아

메타의 AI가 "타임스퀘어에서 춤추는 로봇"이라는 주문에 맞춰 만든 영상. /사진=메타 제공

메타(구 페이스북)가 이용자가 말하는 대로 영상을 만들어주는 인공지능(AI)을 공개했다. 올해 중순 이미지 생성 모델을 공개한 지 두달 만이다.

메타가 개발에 열을 올리는 인공지능 모델들은 추후 메타의 메타버스에 접목될 전망이다. 이용자가 원하는 이미지를 쉽게 만들어 더 다양한 활동을 하고, 자유롭게 개성을 표현할 수 있게 돕는 것이다.

"초상화 그리는 테디베어 만들어줘"

지난달 말 메타는 인공지능 모델 '메이크 어 비디오(Make-A-Video)'를 공개했다. 메이크 어 비디오는 일상에서 사용하는 말로 명령문을 입력하면 영상으로 만들어주는 '텍스트 투 비디오(Text To Video)' 모델이다. "초상화 그리는 테디베어 만들어줘"나 "타임스퀘어에서 춤추는 로봇 만들어줘" 등의 명령문을 넣으면 그대로 영상으로 만들어준다.

시차를 두고 찍은 사진 두 장을 보내주면 영상으로 만들어주는 기능도 더해졌다. 예를 들어 한 사람이 걸어가는 모습의 사진을 찍어 입력하면 알아서 걸어가는 영상을 만들어주는 식이다. 또 입력된 영상과 비슷한 영상을 여러 편 만들 수도 있다. 우주를 떠다니는 우주비행사 영상을 넣으면 다양한 배경에서 유영하는 비행사의 영상을 제작하는 것이다.

텍스트 투 비디오 AI를 만들기 위해 수백만개에 달하는 언어 데이터를 학습시켰다. 대신 혐오 표현 등 사회적 논란을 일으킬 수 있는 콘텐츠가 만들어질 가능성을 낮추기 위해 필터를 적용했다. 또 AI가 만든 영상엔 자사 로고를 부착해 실제 영상이 아님을 표기했다.

메타는 "우리의 목표는 결국 이 기술을 더 많은 사람들이 이용할 수 있게 하는 것"이라며 "하지만 먼저 연구하고, 실험하고, 다양한 시행착오를 하면서 안전하고 계획적인 서비스가 출시될 수 있는 데에 집중하겠다"고 설명했다.

기존 그림을 보고 메타 AI가 만든 동영상. /사진=메타 제공

인공지능, 메타버스에 어떻게 쓰이나

메타는 최근 이 같은 생성 이미지에 적극적인 관심을 보이고 있다. 지난 7월엔 이용자가 말로 설명한 장면을 그림으로 만들어주는 '텍스트 투 이미지(Text To Image)' 모델 '메이크 어 씬(Make-A-Scene)'을 공개하기도 했다. 이미지 생성 모델을 공개한지 두 달 만에 영상 생성 모델을 공개한 것이다.

인공지능 모델 개발에 몰두하는 것은 장기적으로 메타버스 역량을 강화하기 위해서라는 평이 나온다. 가장 큰 장점은 단연 이용자가 원하는 이미지를 언제든 쉽게 만들 수 있다는 점이다. 생성 AI를 활용하면 개발이나 디자인 지식을 갖추지 않고도 원하는 공간이나 인물을 만들어 자신의 개성을 드러낼 수 있다.

저작권 문제가 줄어드는 것도 큰 강점이다. 기존에 있는 이미지를 그대로 구현하는 게 아니라, 이용자의 주문에 맞춰 인공지능이 새로운 이미지를 만들기 때문에 아이템이나 건축물 등으로 저작권 분쟁에 휘말릴 가능성이 낮다.

이미 게임 분야에선 비슷한 사례가 여러번 등장했다. 2017년엔 액티비전 블리자드가 자사 게임 '콜 오브 듀티'에 등장시킨 군용차의 디자인이 AM제너럴의 제품과 모습이 같아 지식재산권 침해로 고소당하기도 했다. 하지만 생성 AI는 단순히 인터넷에 떠도는 이미지를 그대로 사용하지 않고, 직접 새로운 아이템이나 건축물을 만들기 때문에 저작권 분쟁 가능성이 낮을 것이란 전망이 나온다.

AI로 국적 관계없이 실시간 대화 지원

인공지능으로 메타버스 역량을 키우려는 메타의 전략은 이미지와 영상 생성에 그치지 않는다. 올해 2월 마크 저커버그 메타 CEO는 인터뷰를 통해 인공지능 번역 시스템을 개발 중이라고 밝혔다.

NLLB(No Lnaguage Left Behind)라는 이 모델은 200개 언어를 지원한다. 단순히 텍스트를 번역하는 데에 그치지 않고 음성을 인식하고 변환해 실시간으로 대화할 수 있도록 돕는 모델이다.

메타는 이 모델을 적용해 여러 국적의 이용자가 한데 모이는 메타버스에서 언어 장벽을 느끼지 않고 모두와 이야기를 주고받을 수 있는 번역 기능을 더할 전망이다.

더 다양한 인공지능 모델을 만들 수 있도록 슈퍼컴퓨터 개발에도 나섰다. 메타는 언어와 이미지, 영상 데이터를 학습할 수 있는 'RSC'를 연내 구축할 계획이다. 메타는 "RSC는 세계에서 가장 빠른 AI 슈퍼컴퓨터 중 하나"라며 "RSC로 만든 강력한 기술을 적용해 메타버스를 구축하기 위한 포석을 마련할 것"이라고 말했다.

naver daum
SNS 로그인
naver
facebook
google