카카오, AI 안전성 검증모델 '카나나 세이프가드' 공개

이학선 기자 naemal@bizwatch.co.kr
2025.05.27(화) 16:02

자체 언어모델 '카나나' 기술 활용…오픈소스로 배포

카카오가 안전하고 신뢰할 수 있는 생성형 인공지능(AI) 생태계 조성에 나선다.

카카오는 AI 서비스의 안전성과 신뢰성을 검증할 수 있는 AI 가드레일 모델 '카나나 세이프가드(Kanana Safeguard)'를 개발해 오픈소스로 공개한다고 27일 밝혔다.

최근 생성형 AI 서비스의 확산과 함께 유해 콘텐츠의 위험성이 커지면서 카나나 세이프가드를 개발했다고 카카오는 설명했다. 주요 빅테크들도 생성형 AI를 통해 발생할 수 있는 위험요소를 감지하는데 특화한 모델을 운영 중이다.

카나나 세이프가드는 카카오가 자체 개발한 언어모델 '카나나'를 기반 기술로 하고 있다. 한국어와 한국 문화를 반영한 자체 구축 데이터셋을 활용해 한국어에 특화한 성능을 보유했다. AI 모델의 정밀도와 재현율을 평가하는 수치인 'F1 스코어(F1-Score)'를 기준으로 평가한 결과, 한국어 성능에서 글로벌 모델 이상의 성과를 기록했다고 카카오는 설명했다.

이번에 오픈소스로 공개한 모델은 △카나나 세이프가드 △카나나 세이프가드-사이렌(Siren) △카카나 세이프가드-프롬프트(Prompt) 등 총 3종이다. 각각의 모델은 증오·괴롭힘·성적 콘텐츠 등의 유해성, 개인정보와 지식재산권 등 법적 위험, AI 서비스를 악용하려는 사용자 공격을 탐지한다. 모두 '허깅페이스(Hugging Face)'를 통해 내려받을 수 있다.

카카오는 카나나 세이프가드에 상업적 이용과 수정, 재배포 등이 자유롭게 가능한 '아파치2.0(Apache 2.0)' 라이선스를 적용했다. 향후 지속적인 업데이트를 통해 모델을 고도화할 예정이다.

김경훈 카카오 AI 세이프티 리더는 "기술의 발전과 더불어 AI 윤리와 안전성에 대한 중요성이 국내외에서 점차 부각되고 있다"며 "책임감 있는 AI 구축에 대한 인식을 널리 확산시키고 사회적 가치를 고려한 기술 개발이 이어질 수 있도록 선제적인 대응을 이어갈 계획"이라고 말했다.

이학선 기자의 기사 더 보기