카카오 생성AI '칼로 2.0', 직접 써봤습니다

최현서 기자 stringstand@bizwatch.co.kr
2023.07.15(토) 13:00

업데이트 통해 복잡한 한글 명령어 지원
글자·사람 손 표현 등 일부 결과물은 어색

카카오의 생성형 인공지능(AI) '칼로'가 한층 더 똑똑해졌다. 영어만 인식하던 칼로가 한글을 이해하고 복잡한 문장으로 이뤄진 명령어도 잘 받아들였다. 인간처럼 진화한 것이다.

칼로2.0은 카카오의 AI 전문 자회사 카카오브레인이 지난 6일 기존 버전을 업그레이드한 생성형AI다. 카카오브레인이 지난해 12월 세계 최대 오픈소스 커뮤니티 '깃허브'에 칼로1.0을 발표한 이후 진행한 첫 대규모 업데이트다.

이번 업데이트의 가장 큰 특징은 강화된 명령어 이해도다. 칼로2.0은 한글과 영어 명령어를 동시에 이해한다. 기존 버전은 영문만 지원했다.

또 칼로2.0은 더 많은 조건이 붙은 명령어를 이해할 수 있다. 이용자가 '푸른 눈을 가진 새끼 검은 고양이'와 같이 수식어가 들어간 문장으로 명령해도 칼로2.0이 잘 이해한다는 것이다.

실제로 칼로2.0에 난기류를 뚫고 비행하는 항공기를 그리라고 명령했다. 칼로는 명령어를 영어로 번역한 뒤 3초 만에 4장의 결과물을 출력했다. 4장 모두 난기류를 상징하는 나선형의 구름 모양을 잘 표현했다.

카카오의 생성형 인공지능(AI) '칼로'로 난기류를 뚫고 비행하는 항공기를 그린 모습./사진=칼로 캡처

한계도 있었다. 칼로2.0은 다른 생성형AI와 마찬가지로 글자, 사람 손가락 등을 제대로 표현하지 못했다.

칼로2.0에게 반 고흐 그림체의 조 바이든 미국 대통령 초상화를 그리라고 명령하자, 칼로2.0은 고흐의 특징을 살린 강렬한 색감을 통해 바이든 대통령의 모습을 그렸다. 하지만 바이든 대통령의 영어 철자(Joe Biden)는 'JO US DF 2001-BOEDDRA'라고 나타내는 등 제대로 표기하지 못했다. 또 오른손으로 붓을 쥔 화가의 모습을 그리게 하자 손가락이 뒤틀리거나 6개인 모습의 결과물을 보여주기도 했다.

생성형AI가 글자와 사람 손을 제대로 표현하지 못하는 이유는 쉽게 말해 AI의 '퉁'치는 학습 방식 때문이다. 인간은 사람마다 다른 필체, 자음과 모음, 대문자·소문자 등을 구분할 수 있지만 AI는 이런 세부적인 사항을 전부 다 영어로만 묶어서 이해한다.

사람의 손도 마찬가지다. 주먹을 쥐거나 깍지 낀 손 등 관절 움직임에 따라 사람의 손 모양은 달라지지만 AI는 그 모습을 단순한 손으로 학습한다.

칼로2.0으로 반 고흐 풍의 조 바이든 미국 대통령을 그렸지만 일부 문자를 왜곡해서 구현했다./사진=칼로 캡처

AI 전문가들은 생성형AI의 기술적인 한계는 이른 시일 내 해결될 수 있다고 봤다. 전창배 국제인공지능윤리협회 이사장은 "몇 달 전에 비해 손가락 묘사 등은 데이터 조건 설정으로 어느 정도 해결된 상태"라며 "이런 추세를 볼 때 현재 생성형AI의 한계는 가까운 미래에 대부분 해결될 것"고 말했다.

앞으로는 생성형AI가 창작물의 질을 극대화한 특화 서비스로 나아갈 가능성도 있다. 생성형AI가 문제에 대한 정답을 찾는 영역을 강화하거나 완전히 새로운 독창적인 결과물을 만드는 방향으로 성능을 키운다는 것이다.

최병호 고려대 인공지능연구소 교수는 "AI가 최적화된 성능을 구현하기 위한 파라미터(AI를 구성하는 인공 신경망) 수를 유지하면서 AI를 활용한 다양한 서비스를 출시하는 경향이 강화되고 있다"며 "결국 AI의 한계를 극복하고 수준 높은 결과물을 만들어 시장을 선점하려는 모습이 더 뚜렷하게 나타날 것"이라고 말했다.