중국 오픈소스 인공지능(AI) 모델 '딥시크(DeepSeek)'의 등장으로 '네카오'로 주목이 쏠린다. 압도적인 컴퓨팅 자원 없이도 고성능의 AI 모델을 만들 수 있다는 가능성이 열리면서, 인프라 비용을 절감하면서 빅테크를 빠르게 따라잡을 수 있다는 기대가 커졌기 때문이다.
남다른 '가성비'…美 GPT 이긴 中 딥시크
중국 AI 스타트업 딥시크가 지난 20일 선보인 '딥시크-R1'은 오픈소스 대규모언어모델(LLM) '딥시크 V3'를 기반으로 한 추론 특화 AI 모델이다. 딥시크는 비교적 저렴한 저성능 칩으로 분류되는 'H800'을 활용했으며, 딥시크 R1 개발에 투입한 비용은 558만달러(약 78억원)에 불과하다고 밝혀 파란을 일으켰다.
반면 오픈AI는 고성능 AI 칩 'H100'를 썼고, 챗GPT에 약 1억달러(1453억원)에 달하는 비용을 들였다. 그럼에도 수학, 코드, 추론 작업에서 오픈AI의 신형 모델인 'o1'을 앞선 것으로 알려졌다. 딥시크 기술보고서에 따르면 '딥시크-R1'은 미국 수학경시대회인 aime 2024 벤치마크 테스트, 코딩 테스트인 라이브벤치 평가 등에서 o1을 눌렀다.
전문가들은 딥시크가 저성능 칩과 저예산으로도 빅테크의 AI 모델에 맞먹는 성능을 냈다고 본다. 대표적인 것이 '전문가 혼합'(MoE·Mixture of Experts) 기술이다. 작업마다 특화된 여러 영역으로 나누고, 필요한 영역만 활성화하는 방식으로 AI 모델의 효율성을 높인다. 중요한 정보를 빠르게 포착하는 '멀티헤드 잠재 어텐션'(MLA), 추론 속도를 끌어올리는 멀티토큰 예측(MTP)도 핵심 기술로 꼽힌다.
천문학적인 투자비용을 들여 고성능 AI 칩을 활용해야만 AI 모델을 만들 수 있다는 사회적 통념을 깬 것이다. 특히 중국이 엔비디아의 고성능 AI 칩 수입이 제한된 상황에서도 AI 모델을 개발했다는 데 의미가 있다. 알리바바 클라우드도 AI 모델 '큐원 2.5-맥스'를 내놓으면서 딥시크, GPT를 능가했다고 자평했다.
네이버도 가능할까? 국내 기업 기대 커져
딥시크 충격으로 삼성전자와 SK하이닉스 등 반도체업체들은 타격을 입겠지만 국내 소프트웨어 기업에는 기회가 될 수 있다는 전망이 나온다. 더 많은 '가속기'가 없어도 글로벌 빅테크와 견줄 수 있다는 사례를 보여줬기 때문이다. 그간 네이버의 하이퍼클로바, 카카오의 카니나, KT의 마음AI 등 자체 LLM(대규모언어모델)이 나왔지만 글로벌 빅테크와의 경쟁에 밀려 좀처럼 성과를 내지 못했다.
최승호 상상인증권 연구원은 "딥시크가 시장에 충격을 준 이유는 고성능의 모델을 구현하는 데 있어 압도적으로 높은 컴퓨팅 자원이 필요하지 않을 수 있다는 함의를 던져주기 때문"이라면서 "딥시크의 방법론을 제대로 따라할 수 있다면 그동안 인프라 비용 투자가 어려워 진행되지 못했던 국내외 AI 개발이 더 활발해질 수 있을 것"이라고 말했다.
최 연구원은 최대 수혜주 중 하나로 네이버를 꼽으며 "AI 모델을 만들 때 오픈소스 모델 구조를 많이 참고하므로, 오픈소스의 강세는 빅테크와 벌어진 간격을 좁힐 수 있는 기회가 될 수 있다"고 봤다.
저렴한 AI 모델이 보편화되면서 AI 서비스에 강점이 있는 국내 기업들의 시장이 커질 수 있다는 기대도 있다. 익명을 요구한 AI업계 한 관계자는 "이미 작년에 메타의 라마(lama)와 알리바바의 큐원 2.5를 써봤는데 상당한 수준에 달해 있었고, 중국 기술력이 많이 따라잡았다고 느꼈다"면서 "딥시크의 사례가 증명했듯, 우리나라도 창의적인 방식으로 AI에 접근할 필요가 있을 것"이라고 말했다.
개발비용 축소·무단도용 의혹 등 남겨
한편으로 딥시크는 개발비용을 지나치게 축소해 계산했다는 의혹도 남겼다. 아트레이드 매니지먼트의 개빈 베이커 최고투자책임자는 "(딥시크가 밝힌 개발비용에는) 아키텍처, 알고리즘, 데이터에 대한 이전의 연구와 실험에 관련된 비용들이 포함돼 있지 않다"고 지적하기도 했다.
하정우 네이버클라우드 AI 이노베이션 센터장 또한 본인의 SNS(소셜네트워크서비스)를 통해 "딥시크에 대해 오해하면 안 되는 게 정말 저렴한 비용으로 만들었다고 보면 안된다"면서 "1회 학습비용이 적다고 누적투자비용이 적다고 보기 어렵다"고 말했다.
딥시크가 빅테크의 데이터를 무단도용했기에 저렴하게 개발할 수 있었다는 의혹도 제기된다. 마이크로소프트(MS)와 오픈AI는 데이터 유출 여부에 대한 조사에 나선 상태다. 반면 딥시크 측은 라마 등 오픈소스를 활용해 모델을 제작했다고 밝혔다.