금융의 경계가 빠르게 허물어지고 있다. 핀테크·빅테크 업체의 진출이 가시화하면서 기존에는 없었던 서비스가 대거 출시되고 있다. 비즈니스워치가 금융권 변화의 첨병역할을 하는 곳을 찾아 나섰다. [편집자주]
"머신러닝 알고리즘을 적용한 새로운 신용평가 모델로 저축은행 연체율을 3% 수준으로 낮췄다."
솔리드웨어(Solidware)라는 이름을 접한 건 일본 금융그룹 SBI가 2016년 4월 말 발표한 2015사업연도 결산자료에서다. 자회사인 SBI저축은행 주력사업을 프로젝트 파이낸싱에서 개인 및 영세 중소기업 대출로 재편하는 과정에서 솔리드웨어라는 국내 스타트업과 손을 잡을 것이라고 발표한 것이다.
대출을 일으켰는데 상환이 제대로 이뤄지지 않으면 금융기관은 손해를 볼수밖에 없다. 대출의 기준이 되는 신용평가 시스템이 회사 경쟁력과 직결된다. 당시 국내 저축은행 대부분은 외부 신용평가 정보로 시스템을 만들어 대출을 일으켰다. 모두의 리스크 크기가 서로 비슷할 수밖에 없었다.
솔리드웨어는 10개 남짓 변수를 통계 분석해 연체율을 산출하는 기존 방법에서 한걸음 더 나아갔다. 거주 형태와 현금 흐름 등 차주의 비금융 데이터에 주목했다. 하지만 기존 방법으로 수백개 비금융 데이터를 분석하기란 쉬운 일이 아니었다. 솔리드웨어의 해결책은 '머신러닝(Machine Learning)'.
머신러닝은 말 그대로 기계가 자기학습을 통해 일을 처리해내는 일종의 자동화 프로세스다. 수많은 데이터를 투입하면 기계가 정보를 분석해 특정 결과를 도출해 낸다. 금융기관이 갖고 있는 갖가지 데이터를 넣고 연체율을 산출한다면 변수와 결과의 상관관계를 스스로 찾아 함수로 표현해낸다.
새로운 모델 도입 이후 SBI저축은행 연체율은 줄곧 우하향 곡선을 그리고 있다. 2017년 초 9% 남짓한 SBI저축은행 연체율은 올 3월 말 2% 수준으로 줄었다. 최근 네이버파이낸셜이 소상공인 비금융 비정형 데이터를 활용해 자체적 신용평가 모델을 출시하는 등 시장에서 새로운 시도는 계속되고 있다.
데이터 분석 수요가 커지고 있는 지금 솔리드웨어는 무슨 생각을 하고 있을까. 서울 종로 중구에 위치한 솔리드웨어 본사를 찾아 박재현 대표를 만났다. 그는 기업이 갖고 있는 독자적 데이터를 활용하는 것이 경쟁력이 될 것이라면서 자기만의 비즈니스 경험을 데이터 해석 과정에 녹여야 한다고 강조했다.
▲ 솔리드웨어와 인연을 맺은 계기가 궁금하다
- 처음 사회생활을 인공지능(AI) 기술에 특화한 마이더스아이티라는 회사에서 시작했다. 입사 동기가 현재 고위드 내 자회사 중 하나를 창업했는데, 일을 도와달라고 해서 회사를 옮기게 됐다. 지금의 데일리인텔리전스라는 곳이다. 데일리인텔리전스는 고위드가 지분 68%로 지배하고 있는 회사다. 그곳에서 사업을 총괄하던 중 솔리드웨어 창업 멤버 대부분이 고위드 측에 지분을 매각하고 떠났고 경영진을 새로 구성하는 과정에서 지금의 자리로 옮기게 됐다.
▲ 솔리드웨어의 성장을 평가한다면
- 솔리드웨어가 첫 상품을 출시한 게 2017년 2월이다. 어느 기업에서든지 데이터 분석 업무는 반복적으로 이뤄진다. 해당 업무를 자동화할 수 있는 가능성에 주목했다. 머신러닝 기법을 도입해 범용 소프트웨어를 만들었다. 과거엔 엔지니어가 고객사 파견을 가서 문제를 해결했다면 지금은 범용 솔루션을 만들어 공급하고 있는 점이 가장 큰 차이점이다. 취임 당시 임직원은 6명이었지만 현재는 43명이다. 11개국 석박사 출신으로 구성됐다. 지난해 해외 17개국에서 약 50억원 매출을 기록했다. 연평균 180% 이상 매출 성장을 기록하고 있다.
▲ 머신러닝 기반 신용평가 모형이라는 게 무엇인가
- 먼저 개인과 기업 대출을 나눠서 봐야 한다. 개인을 대상으로 일으키는 담보대출은 주택담보대출 말고는 없다고 봐도 무방하다. 신용대출 시장이 잘 형성돼 있다. 데이터가 풍부하다. 대부분 큰돈을 빌리지 않기 때문에 리스크가 적다. 금융업권은 오래전부터 개인 신용대출에 연체이력과 재직여부, 소득수준, 근속기간 등 정보를 합쳐 점수화한 데이터를 갖고 있었다. 여기에 차주의 거주타입과 현금흐름, 카드사용 등 수백수천개에 달하는 비금융 데이터를 더해 정확도를 높이고 싶은데, 데이터가 많기도 하고 계량화가 돼 있지 않아 기존 통계 방법으로는 데이터를 다루기가 쉽지 않았다.
머신러닝이 이것을 해결했다. 해당 변수와 결과의 인과관계를 분석해 함수를 만들어내고, 이를 실제 업무 과정에 도입했다. 머신러닝 기반 신용평가 모형은 최근 5년여간 시장에 빠르게 도입돼 지금은 대중화를 이뤄냈다. 비교적 최근의 일이다. 기업대출은 지난해부터 본격적으로 도입이 이뤄지고 있다. 취급액이 백억원 단위로 리스크가 크고 담보대출이 주류를 이룬 영향이 크다.
▲ 결과는 어땠나
- 변수가 10개 남짓일 때보다 훨씬 많아질 때 정확성은 더 높아질 수밖에 없다. SBI저축은행의 경우 부도율 예측력이 전통 모형 대비 50% 이상 향상됐다. KB캐피탈 역시 예측력이 2배 이상 증가했다. 악사다이렉트의 경우 사고 손해액 예측력이 83% 향상됐다. SBI저축은행의 모회사인 SBI그룹은 SBI저축은행이 새로운 신용평가 모형을 도입해 수익성이 개선됐다고 밝히기도 했다.
▲ 제2금융권 고객사가 눈에 띈다
- 시중은행은 기술이 있다고 해서 마음대로 도입할 수 없다. 바젤 기반의 표준화 신용평가 모델을 자고 있기 때문이다. 새로운 모델을 도입하려면 금융당국 승인을 받아야 한다. 새로운 기술을 도입한다고 하더라도 기존 모델의 정교함을 높이기 위한 보조적 역할에 그칠 수밖에 없다. 하지만 제2금융권은 규제가 상대적으로 덜하다. 대출 대상이 신용등급 4~7등급 사이 저신용자라 제1금융권 모델을 쓸 수 없다는 점도 고려됐다. 신용평가 모델은 회사 경쟁력과 직결되기 때문에 서로 공유하기도 어렵다. 전국 79개 저축은행 중 상위 업체를 제외한 대부분은 자금 여력이 부족해 별도의 모델 도입이 어려워 외부 신용평가 정보를 활용하는데 이는 고도화하지 않았을 가능성이 높다.
▲ 금융권 이외에도 솔루션을 제공하는가
- 물론이다. 우리는 기술회사다. 앞에 금융을 붙이면 금융기술이 되고 유통을 붙이면 유통기술이 되는 것 뿐이다. 파스타를 만들든 김치찌개를 끓이든 같은 냄비를 쓰는 것과 똑같은 이치다. 다른 재료를 넣으면 다른 요리가 나올 뿐이다. 실제 올해 초 일본 내 대형 상사와 계약을 맺었다. 해당 상사는 식품, 바이오, 엘리베이터 등 전 사업 영역을 포괄하고 있다. 타깃마케팅, 조기경보, 사기적발, 이상탐지 분야에서도 충분히 활용할 수 있다.
▲ 데이터 분석 가공 등에 대한 기업의 관심도가 높아지고 있다
- 결국 기업이 어떤 오리지널 데이터를 갖고 이를 활용하느냐가 중요하다. 모든 문제는 데이터로 귀결될 수밖에 없다.
과거 소상공인 관련 리스크를 산출하기 위해 대표자 모델이라는 것을 썼다. 사장의 개인 신용을 해당 사업장 신용으로 갈음한 것이다. 이 경우 사업장의 현금흐름을 제대로 간파하지 못해 오류가 발생할 수밖에 없다. 최근 네이버파이낸셜이 오랜기간 쌓아온 소상공인 데이터를 기반으로 독특한 신용평가 모델을 구축했는데 이것이 좋은 사례다.
다만 데이터 솔루션은 꾸준히 보완해야 한다. 미증유의 사건이 터지면 데이터 자체가 변한다. 상환능력을 가진 소상공인이 코로나19로 사업을 접어야 하는 경우에 처한 경우가 여기에 해당한다. 상황에 맞는 모델을 적시에 제시할 수 있는 능력이 중요하다.
▲ 데이터 관련 인력 수요는 계속 늘어날까
- 단기적 현상일 뿐이다. 오래전부터 있었던 인공지능 기술을 비교적 최근들어 각 산업 영역에 적용하기 시작하면서 생기는 현상 중 하나라고 본다. 데이터 인력 수요 역시 자동화 여부에 따라 직무 존속이 결정될 수 있다. 기술은 상향평준화되기 때문에 장기적으로 인력 가치는 떨어질 수밖에 없다. 업계에서는 전체의 70% 이상이 이미 자동화 작업이 끝났다고 본다.
▲ 자동화가 이뤄지면 솔리드웨어의 경쟁력이 사라지는 것 아닌가
- 솔리드웨어는 머신러닝 기법을 적용한 소프트웨어를 솔루션으로 제공한다. 동아시아 국가를 대상으로 수출 실적도 내고 있다. 실제 작년 매출의 90% 가량이 해외 17개국에서 나왔다. 이런 트랙레코드를 가진 회사는 미국의 데이터로봇(Datarobot)과 에이치투오(H2O) 등 두곳 정도에 불과하다.
시간이 갈수록 엔지니어에 대한 의존도는 작아질 텐데, 이때 중요한 것은 시장 점유율이다. 마이크로소프트 엑셀과 같은 프로그램을 개발하기 어려워 지금의 점유율을 차지하고 있는 게 아니다. 시장 초기 단계에 형성된 사용자 습관이 반영됐기 때문에 바뀌지 않는 것이다.
▲ 자체적으로 별도의 서비스를 계획하고 있는가
- 능력을 벗어나는 일이다. 솔리드웨어는 고객 문제를 해결하는 기술 기업 정체성을 지켜나갈 것이다. 지금 단계에서는 투자 유치 활동과 홍보 활동을 자제하려고 한다. 시장과의 관계를 먼저 명확하게 설정해야 한다고 생각하기 때문이다. 투자를 유치하려면 아이디어를 상품화하는 작업을 끊임없이 진행해야 하는데 그 과정에 주력하다보면 고객사 문제를 푸는 데 지금보다 노력을 덜 기울일 수밖에 없다. 상품을 만들고 이를 최적화시키는 과정이 힘든 과정이다. 여기에 힘을 쏟아야 한다. 홍보 활동을 자제하고 있는 것도 마찬가지다. 현실적 입장을 유지하고자 한다.
▲ 데이터를 다루는 데 중요한 역량은
- 물론 개발과 이론 지식이 필요하다. 하지만 이 영역은 자동화할 수 있다. 여기에 특정 산업 영역의 지식이 더해져야 한다. 비즈니스 경험을 데이터 분석 능력에 녹여내는 것이다. 현재 포스텍(포항공대)과 데이터트랜슬레이터(Translator·번역) 과정을 운영하고 있다. 각 산업 영역에 있는 방대한 데이터를 어떻게 현업에 적용시켜 업무를 효율화할까를 고민하고 있다.
▲ 11개국 출신 석박사 인력을 관리하는 건 어떤 느낌인가
- 관리라는 관점에 동의하지 않는다. 회사가 비전을 제시한다고 직원들이 전적으로 동감하는 것도 아니다. 대표이사가 강력한 카리스마로 회사를 이끌어가는 건 과거 유물에 불과하다. 생각은 들여다 보고 싶어도 들여다 볼 수가 없어 관리 자체가 불가능하다. 결국 개인이 즐겁게 일을 하는 것 자체가 제일 중요하다. 솔리드웨어는 데이터 분석 업무 자체를 즐기고 있는 인원들로 구성돼 있다.
▲ 데이터 중요성을 잘 모르는 분에게 조언을 해준다면
- 누군가 컨설팅을 요청한다면 가장 먼저 어떤 데이터를 갖고 있느냐고 물어볼 것이다. 데이터가 없다면 데이터를 수집하라고 하겠다. 김치찌개를 끓이고 싶은데 김치가 없으면 애초에 시작을 못하는 것 아닌가. 지금 당장 내가 갖고 있는 데이터로 무엇을 할 수 있을지 고민하는 것이 가장 중요하다.