• 검색

LG가 밝힌 AI 전략 '소량 데이터로도 전문가를 더 전문가답게'

  • 2023.05.08(월) 06:45

창간10주년기획 [DX인사이트]
최정규 LG AI연구원 멀티모달 AI그룹장 인터뷰
엑사원 유니버스·아틀리에·디스커버리 서비스 진화중

최정규 LG AI연구원 멀티모달 AI 그룹장 /사진=김설아 PD kimseola@

"AI(인공지능)가 산업에 적용되면 DX(디지털 전환) 측면에서 굉장히 많은 혁신이 있을 것입니다. 고객 상담 과정에 적용될 경우 AI가 직접 고객의 말을 분석해 대응할 수 있어요. LG의 경우 제조 개발 영역에서 새로운 물질·제품을 개발할 때 굉장히 빠르게 효과를 본 경험도 있습니다. 제품 개발 시 문제됐던 것을 데이터베이스화해 AI와 협업으로 해결하고 있습니다."

20여 년간 LG에서 AI를 연구해 온 최정규 LG AI연구원 멀티모달AI 그룹장의 말이다. 그는 산업 분야에 AI가 적용될 경우 업계의 큰 반향을 일으킬 수 있다는 기대감을 품고 있다. 그 중심에는 LG AI연구원이 지난 2021년 공개한 초거대 AI '엑사원'이 있다.

▷관련기사: 챗GPT-4보다 15개월 앞섰다…LG AI '엑사원' 넌 누구니(5월2일)

"전문가를 더 전문가로 만들자"

엑사원(EXAONE)은 'EXpert AI for everyONE'의 준말이다. 전문가를 위한 초거대 AI를 지향한다. 쉽게 말해 전문가들의 업무 효율성을 높여주기 위한 AI다. AI가 사람을 대체하는 것이 아니라 사람에게 도움을 주는 역할을 하는 셈이다.

최 그룹장은 "챗GPT가 일반적인 범용 초거대 AI라면, 엑사원은 LG가 추구하는 전문 분야에서의 초거대 AI"라며 "전문가 입장에서 필요한 전문 지식을 제공함으로써 전문가가 원하는 분야에 실질적 성과를 나타내는 것을 목표한다"고 말했다.

예를 들어 소재 개발의 경우 선행연구를 하기 위해 많은 연구과정과 시간이 필요하다. 이때 초거대 AI로 논문·특허 등 전문 문서를 분석해 데이터베이스를 구축하면 많은 정보를 빠르고 쉽게 얻을 수 있다. 전문가가 직접 방대한 양의 문서나 논문을 읽고 분석하는 과정을 거칠 필요가 없다. AI 덕에 시간을 절약한 전문가는 그들의 전문 지식을 살린 개발에 집중할 수 있다.

최 그룹장은 "소재 구조를 설계하는 단계에서도 AI는 많은 소재를 빠르게 검토하고, 원하는 물성을 예측하는 것까지 가능하다"며 "개발, 검증 단계에선 소재 합성 경로를 최적화해 예측까지 해줘 합성 실패 사례를 최소화할 수 있다"고 설명했다.

LG는 산업계에서 풀지 못했던 문제를 해결하거나, 해결하는데 소요되는 시간을 획기적으로 단축하기 위해 초거대 AI 개발에 뛰어들었다. 현재 LG 주요 계열사에서는 엑사원을 비롯한 AI 기술을 다양하게 활용하고 있다. 나아가 산업계 AI의 적용 확대를 위해 전문 지식이 없거나 AI 개발자가 아니어도 쉽고 간편하게 초거대 AI를 사용할 수 있는 서비스 플랫폼도 도입했다. 

엑사원 디스커버리 서비스는 논문과 특허 등 전문 문헌을 학습해 난제 해결 기반을 쌓아간다. /사진=LG 제공

먼저 언어를 기반으로 한 엑사원 '유니버스'는 챗GPT와 유사하게 텍스트를 요약·분석·답변하는 서비스다. 현재 LG생활건강을 비롯해 LG전자, LG유플러스에 적용하고 있고 여러 외부 파트너사에도 도입을 시작했다.

엑사원 '아틀리에'는 기존까지 AI의 범주가 아니라고 여겨졌던 창작 영역에 초거대 AI를 적용한 서비스다. 엑사원 아틀리에는 텍스트-이미지 양방향 생성이 가능한 멀티모달 특성이 크게 반영됐다.

엑사원 '디스커버리'는 논문∙특허 등 전문 문헌의 텍스트뿐만 아니라 수식, 표, 이미지까지 스스로 학습해 데이터베이스화 하는 기술을 적용했다. 

적은 데이터로도 신뢰성↑

최 그룹장은 타 초거대 AI와 엑사원의 차별화 포인트로 '신뢰성'을 꼽았다. 최근 화제가 된 챗GPT 등 AI 언어 모델은 '할루시네이션(환각·환영)' 문제를 안고 있다. 출처가 분명하지 않거나 가짜뉴스로 데이터를 학습하면, 사실이 아닌 것도 사실처럼 이야기해 정보의 진위를 가릴 수 없다. 이에 비해 엑사원은 산업 분야의 전문적인 데이터를 학습하기 때문에 다른 초거대 AI 모델에 비해 신뢰도가 높다는 게 그의 설명이다.

최 그룹장은 "현재 초거대 AI는 정확하지 않은 답변이 생성될 수밖에 없는 기술적 한계를 갖고 있는데, 엑사원은 정확한 전문 분야를 학습하고 이 학습 데이터로부터 답변이 정확하게 일치하는지를 근거와 함께 명확하게 제시할 수 있는 부분이 차별화됐다"고 강조했다. 

LG AI연구원 /사진=LG 제공

적은 데이터로도 높은 수준의 성능을 낸다는 것도 엑사원의 장점 중 하나다. 초거대 AI는 대용량 연산이 가능한 컴퓨팅 인프라를 기반으로 대규모 데이터를 스스로 학습한다. 사람으로 치면 세상의 모든 지식을 학습시킨 '천재' 같은 존재다. 덕분에 초거대 AI를 산업에 적용하기 위해 필요한 튜닝(tuning) 과정도 원활하게 진행할 수 있다. 튜닝은 초거대 AI에 산업영역별 전문지식을 추가로 학습시키는 것을 말한다. 

최 그룹장은 "책을 많이 읽은 사람이 시험 문제를 더 쉽게 잘 풀 수 있듯이, 엑사원은 세상에 있는 모든 책을 한 번 읽어본 다음 문제를 푼다고 생각하면 된다"며 "많은 데이터를 통해 언어 간 관계를 미리 학습했기 때문에 적은 데이터만으로도 기존 한계를 뛰어넘을 수 있다"고 설명했다.

이어 "기존에는 하나의 기능을 개발하기 위해 데이터를 별도로 구축하고 이에 맞는 튜닝·개발 과정이 필요했는데, 엑사원으로 학습하면 여러 분야에 쉽게 적용이 가능하다"며 "실제 엑사원을 AICC(인공지능 활용 고객센터)에 적용해 보니 기존 대비 10분의 1 데이터로도 기존보다 높은 수준의 성능을 냈다"고 부연했다.

이런 장점에도 LG AI연구원이 초거대 AI 개발 단계에서 가장 애를 먹는 부분은 '데이터 확보'다. 적은 양의 데이터로도 높은 성능을 내긴 하지만, 데이터 자체를 확보하는 것이 가장 중요해서다. AI 시장 경쟁을 '데이터 전쟁'이라고 표현하는 이유다. 특히 한국어 데이터는 절대량이 적어 확보하기 어렵고, 전 세계 시장에서 차지하는 비중도 미미하다.

최 그룹장은 "AI 확산, 특히 전문 분야로의 확장을 위해선 (데이터 확보를 통해) 신뢰도 문제를 풀어야 한다"며 "LG는 이를 위해 데이터를 갖고 있는 글로벌 기업들과 협업하는 등 많은 노력을 하고 있고, 학습데이터로부터 답변을 검증하는 기술이 풀리면 AI 시장은 더욱 확대될 것"이라고 내다봤다.

최정규 LG AI연구원 멀티모달 AI 그룹장 /사진=김설아 PD kimseola@

인간을 위한 AI

LG가 일반인이 아닌 전문가를 상대로 한 초거대 AI를 개발한 것도 이 때문이다. LG는 전문 지식을 기반으로 한 초거대 AI 서비스부터 시작해 안정성과 신뢰성을 확보한 뒤, 일반 대중을 위한 범용 서비스를 공개하겠다는 구상이다. 할루시네이션 등으로 인해 발생한 윤리 문제가 발생할 여지를 최소화하겠다는 것이다.

최 그룹장은 "엑사원은 전문가 서비스를 지향하기 때문에 현재 기업 대상으로만 서비스하고 있고, 시간이 지나면 일반인 대상 서비스도 나올 것"이라고 언급했다.

엑사원은 현재 기업 대상 서비스지만, LG AI연구원은 화학·제약·바이오 업계에서의 엑사원 활용도가 높아지면 장기적인 관점에서 인간의 삶을 윤택하게 할 수 있을 것으로 보고 있다.

최 그룹장은 "엑사원은 전문가에게 도움을 줘서 더 높은 수준의 결과를 만드는 것을 지향한다"며 "LG AI연구원은 백신 개발의 첫 단계인 신항원을 예측하는 AI를 개발해 인간 생명 연장에 도움을 주거나, 차세대 전지 개발을 통해 효율적이고 공해 없는 배터리를 제공하는 등의 결과물을 만들고 싶다"고 말했다.

AI 기술 발전이 빨라지면서 그들이 바라보는 미래도 빠르게 다가올 것으로 전망했다. 그는 "현재 AI는 특정 영역에서 인간 수준을 넘어서고 있지만 전반적인 범위에서 가야 할 길이 많다"면서 "다만 기술혁신 속도가 빨라지고 혁신의 주기도 짧아지고 있어 앞으로 할 일이 많아질 것이다"고 관측했다.

그는 AI 도입에 따른 인간의 사고 능력 퇴화, 일자리 상실 등의 우려에 대해선 "인간이 집중해야 하는 창의적이나 고도 영역은 반드시 있다"며 "AI는 인간이 최종 판단할 수 있도록 발전해야 한다"고 제언했다.

naver daum
SNS 로그인
naver
facebook
google