• 유튜브
  • 검색

tvN 드라마에 전미도 화면해설 나오는 과정 살펴보니

  • 2022.07.05(화) 14:41

CJ올리브네트웍스, AI 보이스 클로닝 기술 적용
텍스트만 입력하면 음성 자동 생성
시각장애인 화면해설방송 제작과정 줄여줘

tvN 토일 드라마 '환혼'. 이 콘텐츠를 시청할 때 TV 음성다중을 설정하면 화면해설방송이 나온다. 

화면해설방송은 시각장애인을 위한 것으로 등장인물의 표정이나 몸짓, 장면전환 등 상황을 음성으로 설명해줘 이해를 돕는 서비스다.  

하지만 화면해설방송을 제작하는 일이 쉽진 않다. 각 장면별로 상황을 설명해주는 내용을 음성 녹음한 뒤, 드라마 속 주음성과 믹싱한 후 부음성에 실어서 음성다중으로 송출하는 방식을 따른다. 최종 편집 후 다시 사운드믹싱을 해야하기 때문에 긴 제작 시간이 소요된다.

이런 불편함을 CJ올리브네트웍스가 해결했다. 

CJ올리브네트웍스는 각 장면별로 상황에 맞게 텍스트만 입력하면 텍스트에 맞는 음성을 자동으로 찾아 서비스하는 인공지능(AI) 기술을 지원한다. 

예를들면 배우 전미도가 AI 학습을 위해 다양한 예시 문장을 우선 녹음한다. 이때 드라마속 장면설명을 다 녹음하는게 아니라 여러 문장들이 뒤섞인 일반적으로 예시문을 녹음한다. 

이후 'AI 보이스 클로닝(AI Voice Cloning)'이라 불리는 기술을 통해 드라마속 장면설명에 맞게끔 텍스트만 입력하면 그에 맞는 음성이 자동구현되는 방식이다. 음성은 전미도씨의 목소리로 들려진다. 

CJ올리브네트웍스 관계자는 "이 기술로 매 콘텐츠마다 전체 분량을 녹음하지 않아도 시각장애인을 위한 화면해설방송을 제작할 수 있게 됐다"면서 "일정 시간 녹음해 둔 목소리를 기반으로 AI가 여러 프로그램의 화면 해설 음성을 자동으로 생성할 수 있다"고 설명했다.

그는 또 "화면 소리에만 의존해 콘텐츠를 소비해야 하는 시각장애인에게 친숙한 유명인의 목소리를 통해 보다 특별하게 콘텐츠를 즐길 수 있도록 했다"면서 "시청 소외 계층을 포함 모든 시청자들이 보이스 클로닝 등을 활용해 차별화된 콘텐츠 경험과 높은 몰입으로 감동을 느낄 수 있도록 하겠다"고 밝혔다.

naver
SNS 로그인
naver
facebook
google