업비트 운영사 두나무가 세계적으로 권위있는 학술대회에서 전산언어학 관련 논문을 발표하고 기술적 우수성을 입증하는 쾌거를 이뤘다.
두나무는 아랍에미리트(UAE) 아부다비에서 지난 21일 열린 국제 전산언어 학술대회인 '콜링2025' 컨퍼런스에서 자사 머신러닝(ML)팀이 '텍스트-SQL(구조화된 질의 언어)' 변환 관련 연구 논문을 발표했다고 23일 밝혔다.
학회에서 이동준 두나무 머신러닝팀장은 두나무가 개발한 텍스트-SQL 변환 모델의 연구 성과를 발표했다. 논문 제목은 'MCS-SQL: 텍스트-SQL 변환에서 다중 프롬프트와 다지선다를 활용하는 방법'으로 대규모 언어 모델(LLM) 기반의 텍스트-SQL 변환 성능을 향상시키는 방법을 제안했다.
기존 LLM은 질문 방식이나 문장 배치순서 등에 따라 답변이 확연히 달라지는 비일관적인 문제점이 있었다. 이러한 문제를 해결하기 위해 두나무는 다중 프롬프트 기법을 도입해 최적의 SQL을 선택하는 방법을 제안했다. 이 모델은 지난해 텍스트-SQL 변환 측정 벤치마크인 'BIRD-SQL 글로벌 리더보드'에서 1위를 차지하기도 했다.
이 팀장은 "생성형 AI와 함께 주목받는 텍스트-SQL 변환 분야에 대한 기술적 도전이 세계적으로 인정받아 기쁘다"며 "이번 연구가 AI의 실질적 활용성을 넓히는데 조금이나마 보탬이 됐으면 좋겠다"고 말했다.