• 카카오스토리
  • 검색

[네이버 AI]①6개월만에 세계최고 달성

  • 2018.10.25(목) 17:02

문자인식기술 '세계수준' 끌어올려
AI로 개발속도·서비스 경쟁력 높여

 

인터넷 검색 포털에서 출발한 네이버가 인공지능 영역에 과감한 투자를 통해 새로운 성장 동력을 찾고 있다. 글로벌 시장에서 인공지능은 모바일에 이어 사용자를 만나는 새로운 접점으로 주목받고 있기 때문이다. 이른바 '기술 플랫폼'으로 진화하겠다는 네이버 인공지능 기술력의 현재와 미래를 진단해본다. [편집자]

◇ 네이버가 세계 1등한 'OCR'은…

"선배, 저희 사기당하는 거 아니죠?"

 

지난 4월 스타트업 취재차 찾은 이스라엘 텔아비브에서 받은 영수증엔 그림 같은 글이 잔뜩 적혀있었다. 아라비아 숫자 외에는 아는 글자가 없었다.

 

야심차게 네이버의 번역 앱 '파파고'를 실행했다. 아뿔싸. 히브리어 지원이 안 됐다. 구글 번역 앱을 실행해봤다. 히브리어가 지원됐다. 스마트폰 카메라로 영수증을 촬영하고 글자를 손으로 문지르면 한글로 번역됐다. 덕분에 주유할 때 히브리어로 적힌 가솔린과 디젤도 가뿐하게 구별할 수 있었다.

 

네이버가 6개월만에 세계적 수준의 실력을 확보한 첨단 기술도 이와 비슷한 것이다. 문자인식기술(OCR·Optical Character Recognition)이다. OCR은 쉽게 말해, 스마트폰 카메라로 촬영한 이미지에서 문자를 추출해 의미를 파악해주는 기술이다. 여행할 때나 쇼핑할 때, 학습할 때도 편리하게 쓸 수 있다.

 

▲ 히브리어로 적힌 영수증. 문자인식기술은 처음 보는 언어도 해독하는 서비스를 제공한다. [사진=김동훈 기자]

 

아쉽게도 네이버는 구글보단 다양한 언어를 지원하지 않지만, 기반 기술 만큼은 세계적 실력을 갖췄다. 지난 7월 국제패턴인식협회(IAPR)이 개최한 'ICDAR 로버스트 리딩 컴페티션'(Robust Reading Competition)에서 세 가지 부문 1위를 차지할 정도다.

네이버의 인공지능 플랫폼 '클로바'(Clova)와 인공지능 통번역 서비스 '파파고'(Papago)의 공동 OCR 연구팀이 일궈낸 성과다. 알리바바, 텐센트, 센스타임 등 글로벌 클래스의 경쟁자를 물리치고 가장 높은 점수를 기록한 결과다.

해당 기술은 영어를 포함한 라틴 계열의 문자뿐만 아니라, 한국어, 일본어, 중국어, 아랍어, 벵골어, 특수 기호 등 총 7개의 문자 영역을 검출하는 기술로 단일 언어를 검출하는 것보다 훨씬 고도화된 기술력이 요구된다.

 

◇ 숨은 조력자 '인공지능'

 

네이버가 이런 기술을 어떻게 개발했는지도 관심이지만 개발 속도 역시 눈길을 끈다. 연구팀은 올 1월 초 연구에 본격 돌입한 것으로 알려졌다. 세계 최고의 수준을 갖추기까지 딱 6개월밖에 걸리지 않은 셈이다.

비하인드 스토리는 이렇다. 지난 1~2월 연구팀은 글로벌 기술 트렌드 파악에 주력했다. 핵심 논문 약 82편을 분석했다. 이중에서 36편을 추려 깊이 있게 들여다봤다. 쓸만한 기술을 분류하고 구현이 가능한지 따져봤다. 여기까지 했는데 5월이 됐다. 그런데 도중에 문제가 생겼다.

구현 가능하다고 판단한 기술이 모두 영어에 관한 것이었기 때문이다. 네이버는 한국뿐만 아니라 일본, 동남아, 북미 등에서도 사업을 하는 글로벌 사업자다. 특히 일본에선 국민 모바일 메신저로 통하는 '라인'을 서비스하고 있다. 일본어 연구는 필수적이었다. 하지만 일본어는 영어와 다른점이 너무 많았다.

띄어쓰기는 없고, 세로쓰기가 많았다. 한자 또한 많았다. 영어가 26자라면 일본어 글자는 대략 3000개. 이런 점을 고려해 글자 단위로 이미지를 뽑은 뒤 이를 합쳐서 분석하는 기술을 적용했다. 다른 대부분의 논문은 문장 단위로 이미지를 추출해 분석했다.

문제는 네이버가 시도한 것처럼 글자 단위로 추출한 기존 사례를 찾기 어려웠다는 점이다. 기술이 제대로 된 것인지 확인할 모범 답안이 없는 꼴이다. 이와 관련한 방법론도 새롭게 연구해야 했다. 품질을 고도화하기 위해 필기체와 회전된 글자를 인식하는 기술도 개발할 예정이다.

이런 작업을 사람이 모두 할 순 없었다. 연구의 속도를 올려준 핵심 동력은 인공지능(AI)이었다. 컴퓨터가 사람의 뇌처럼 학습하고 사물을 분류·분석하는 '딥러닝' 기술이 도입돼 빠른 속도로 많은 정보를 처리할 수 있었던 것이다.

 

네이버 고위 관계자는 "딥러닝 도입으로 급격하게 성능을 향상시킬 수 있었다"고 설명했다. 네이버는 작년 6월 딥러닝 학습 데이터 센터를 구축해 개발 경쟁력을 끌어올리기 시작한 바 있다. 

현재 이 기술은 이미지 검색 서비스인 스마트렌즈와 파파고, 네이버사전에 적용됐다. 지원 언어는 현재 한국어와 중국어, 영어, 일본어인데, 향후 지속 확대할 계획이다.

 

이런 기술력이 더욱 고도화하면 신분증, 자격증이나 사업자 등록증 등의 문자를 분석해 다양한 비즈니스 모델로 발전시킬 수도 있다. 네이버가 지난해 말 인수한 명함 앱 '리멤버'와 같은 사업 모델이 가능하다는 얘기다.

 

▲ 파파고 서비스 소개. [사진=네이버]

◇ 인공지능으로 서비스 경쟁력 높여

자율주행과 쇼핑검색 등 네이버가 새롭게 선보이는 서비스 대부분도 이같은 인공지능 기술의 도움을 받고 있다.

네이버가 코리아텍과 산학협력으로 개발 중인 로봇 팔 '앰비덱스'(AMBIDEX)는 인공지능 기술 영역인 '심층강화학습'(deep reinforcement learning)을 적용, 고도화 작업을 진행하고 있다. 이를 통해 사람과 직접 상호작용하는 로봇으로 업그레이드할 계획이다.

네이버의 사업 기반인 검색 서비스도 인공지능 서비스의 도움을 받는다. 네이버가 최근 모바일 앱에 적용한 일종의 만능 버튼인 '그린닷'(GreenDot)을 누르면 현재 들리는 음악 찾기·음성인식·사용자 주변 추천 등 다양한 인공지능 기반 서비스가 쏟아진다.

 

쇼핑검색의 경우도 인공지능 기술이 적용된 '스마트렌즈'가 검색 대상을 자동 분석해 최적의 결과를 찾아 추천해준다. 가령 사용자가 가방 사진을 촬영해 업로드하면, 그것과 동일한 상품 정보뿐만 아니라 유사한 목록도 제시하는 식이다.

 

이는 사용자의 수요가 갈수록 다양해지면서 인공지능을 통해 빅데이터를 분석, 맞춤형 서비스를 제공해야 하는 환경으로 바뀌고 있는 점을 선제적으로 반영한 것이다.

인공지능으로 서비스 경쟁력을 높이면 결과적으로 네이버의 이익이 된다. 사용자 경험이 제고되면 네이버에 머무는 사람과 시간이 늘어나고 이를 기반으로 광고 등을 붙이는 등 각종 수익화 사업도 가능하다는 설명이다. 제품과 서비스 자체를 판매할 수도 있다.

 

번역기 파파고의 경우 현재 다운로드 수가 1600만 건이고 월간 이용자 수는 820만명인데, 네이버는 OCR 기능의 확대 적용으로 연내 다운로드 2000만 건을 돌파할 것으로 관측하고 있다.

 

SNS 로그인
naver
facebook
google