MTN NEWS
 

최신뉴스

'너의 목소리가 보여' 음성기술 집중하는 네이버와 카카오

조은아 기자

네이버 '오디오클립'

[머니투데이방송 MTN 조은아 기자]

인터넷 기업들이 인공지능(AI) 기술을 바탕으로 음성기술 개발에 집중하고 있다. 모바일 기기의 발전과 인공지능에 대한 관심이 커지면서 음성 기술의 필요성이 계속 증가하는 추세다.

네이버는 최근 주목받는 음성 기술과 콘텐츠를 결합한 '오디오클립' 베타 서비스를 출시했다.

오디오클립은 팟캐스트와 비슷한 성격의 플랫폼이다. 지식, 교양·실용 분야의 오디오 콘텐츠 위주로 구연동화, 미술관·박물관 등 '프리미엄 오디오 가이드', 오디오 포맷의 잡지 '오디오진(AudioZine)', '오디오 레시피'등을 담는다.

네이버는 플랫폼 차별화를 위해 네이버가 자체 개발한 음성합성 기술 '엔보이스(nVoice)', 음성인식 기술 등을 활용한다. 예를 들어 엔보이스를 활용해 여러 명의 가상인물이 대화하듯 이야기하는 콘텐츠를 만들어낼 수도 있다.

향후 다양한 기능도 추가할 계획이다. 음성으로 올린 실시간 댓글이 다시 이용자들에게 텍스트와 음성으로 전달되는 '음성 댓글', 스크립트를 자동으로 추출해 재생 환경에서 보여주는 '오디오 스크립트 자동 추출', 키워드를 입력해 원하는 위치를 찾아 주는 '오디오 검색', 음질을 보다 선명한 소리로 조정하는 '오디오 자동 보정' 등이 그 예다.

네이버는 오디오클립 뿐 아니라 음성 콘텐츠 시장을 겨냥한 다양한 시도를 하고 있다.

인공지능 기술, 엔보이스, 통번역 기술 등을 바탕으로 국문 영문 뉴스에 오디오 기능을 접목한 '듣는 뉴스', 쥬니버 대화검색, 유인나 씨의 음성을 분석해 음성합성 기술을 접목한 '유인나 오디오북', '사전 예문듣기', 번역기·통역기 문자음성 자동변환 기술(TTS), 문화재 해설듣기 등이 그 예다.

네이버는 음성 콘텐츠 생태계 활성화를 위해 음성 관련 기술 및 콘텐츠에 향후 300억원을 투자할 계획이다.

네이버의 음성 기술 개발은 AI 연구와도 연결된다. 네이버가 내세우는 '생활환경지능'의 한 요소가 바로 음성기술이다. 말하는 사람의 의도를 파악해 적합한 서비스를 수행하는 음성대화시스템 '아미카'가 그 성과 중 하나다.

네이버 관계자는 "오디오클립 베타 서비스는 차세대 오디오 관련 시장을 위해 네이버가 준비하는 오디오 기반 기술, 플랫폼, 하드웨어 등과 결합될 것"이라며, "이를 위한 다양한 기술적 지원과 함께 여러 콘텐츠 콘텐츠 창작자들과 함께 새로운 오디오 콘텐츠 생태계를 만드는 파트너십을 맺을 계획"이라고 말했다.

카카오내비의 음성검색 서비스

카카오도 음성 기술 개발에 힘쓰고 있다.

카카오는 입력된 목소리를 문자로 변환, 음성 검색 서비스를 가능케 하는 음성 인식 엔진 ‘뉴톤’을 자체 개발하고 2014년 2월 API를 개방했다.

같은 해 6월 입력된 문자를 음성으로 변환해 사람이 읽어주는 것처럼 자연스럽게 들려주는 음성 합성 엔진 '뉴톤 톡'을 개발해 기존 음성 인식 API에 해당 기능을 추가해 인식과 합성이 모두 가능한 음성 API를 완성했다.

이는 방대한 양의 데이터베이스와 딥러닝 기술이 바탕에 있었기 때문에 가능했다. 카카오는 '뉴톤'에 딥러닝 기술을 적용해 인식률을 높였다.

카카오는 자체 서비스 내 음성 기술 적용 범위를 확대할 계획이다. 현재 음성 검색이 가능한 카카오맵, 카카오내비, 다음앱 외에도 카카오지하철과 카카오버스 앱에도 음성 검색 기능 도입할 예정이다. 올해 상반기 내 음성 합성 엔진을 이용해 다음뉴스의 뉴스 콘텐츠를 음성으로 변환해 주는 뉴스 읽기 서비스도 추가된다.


[머니투데이방송 MTN = 조은아 기자 (echo@mtn.co.kr)]

머니투데이방송의 기사에 대해 반론·정정추후 보도를 청구하실 분은 아래의 연락처로 연락주시길 바랍니다.

고충처리인 : 콘텐츠총괄부장 ombudsman@mtn.co.kr 02)2077-6288

MTN 기자실

경제전문 기자들의 취재파일
전체보기

    Pick 튜브

    기사보다 더 깊은 이야기
    전체보기

    엔터코노미

    more

      많이본뉴스