2022년 11월 베타 버전이 등장하며 전 세계적 관심을 끌었던 대화형 인공지능(AI) '챗GPT'. 이후 챗GPT 개발사인 오픈AI는 텍스트와 이미지를 양방향으로 인식하는 멀티모달 기술을 더해 올 3월 GPT-4 버전을 선보였죠.
그런데 챗GPT-4보다 15개월 앞서 양방향 멀티모달 AI를 선보인 국내 기업이 있다는 사실, 알고 계시나요? 바로 LG의 초거대 AI '엑사원'인데요.
최정규 LG AI 연구원 멀티모달 AI 그룹장을 만나 산업계의 DX(디지털 전환)를 이끌 엑사원의 개발 스토리를 영상에 담아봤습니다.
▷관련기사: LG가 밝힌 AI 전략 '소량 데이터로도 전문가를 더 전문가답게'(5월8일)
엑사원(EXAONE)은 'EXpert AI for everyONE'의 준말입니다. 전문가를 위한 초거대 AI를 지향하고 있는데요. 쉽게 말해 전문가들의 업무 효율성을 높여주기 위한 AI라고 할 수 있습니다. AI가 사람을 대체하는 것이 아니라 사람에게 도움을 주는 역할을 하는 셈이죠.
LG는 산업계에서 풀지 못했던 문제를 해결하거나, 해결하는데 소요되는 시간을 획기적으로 단축하기 위해 초거대 AI 개발에 뛰어들었습니다. 현재 LG 주요 계열사에서는 엑사원을 비롯한 AI 기술을 다양하게 활용하고 있고요. 나아가 LG는 산업계 AI의 적용 확대를 위해 전문 지식이 없거나 AI 개발자가 아니어도 쉽고 간편하게 초거대 AI를 사용할 수 있는 서비스 플랫폼도 도입했습니다.
초거대 AI는 대용량 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 스스로 학습합니다. 사람으로 치면 세상의 모든 지식을 학습시킨 '천재' 같은 존재죠. 덕분에 초거대 AI를 산업에 적용하기 위해 필요한 튜닝(tuning) 과정도 원활하게 진행할 수 있다고 합니다.
엑사원은 개발 초기부터 '초거대 멀티모달 AI'를 목표로 했습니다. 그 덕에 '텍스트-이미지 양방향 사고가 가능한 세계 최초 멀티모달 AI' 개발에 성공할 수 있었다고 하는데요.
기존 초거대 AI는 언어에 중점을 둔 모델이 대부분이었습니다. 텍스트 혹은 자연어를 이해하는 데 집중했기 때문에 텍스트로만 입·출력이 가능했죠. 이에 비해 멀티모달 AI는 다양한 모달리티(양식·양상)를 동시에 받아들이고 사고하는 AI 모델입니다. 언어뿐 아니라 이미지도 학습해 사고·판단할 수 있습니다. 쉽게 말해 AI에 눈이 생긴 셈입니다.
▷관련기사: 챗GPT-4보다 15개월 앞섰다…LG AI '엑사원' 넌 누구니(5월2일)
이 밖에 전문가 AI 엑사원이 다른 초거대 AI와는 어떤 차별점을 지니고 있는지, 영상을 통해 알아보시죠.