"AI 기반 TTS 음성 나레이션 문서/이미지 뷰어"

DocZoom VoiceBook 은 DocZoom 문서에 AI 기반 TTS 음성 콘텐츠를 추가하여 DocZoom 문서의 활용성을 높여주는 DocZoom Server 제품용 확장 기능입니다.

  • 신경망 AI 기반의 자연스러운 보이스 오디오 생성
  • DocZoom 뷰어와 연동되는 음성 나레이션
  • 성별/언어에 따른 다양한 AI 성우 지원
  • PC부터 모바일 까지 다양한 장치 및 웹브라우저 지원

Overview

DocZoom VoiceBook은 은 DocZoom 문서에 AI 기반 TTS 음성 콘텐츠를 추가하여 DocZoom 문서의 활용성을 높여주는 DocZoom Server 제품용 확장 기능입니다.

DocZoom VoiceBook은 신경망 기반 AI TTS 음성을 이용하여 딱딱한 기계음이 아닌 실제 사람 목소리에 가까운 자연스러운 보이스 오디오를 생성해주며, 생성되는 보이스 오디오는 단순한 오디오 파일이 아닌 DocZoom과 연동되도록 되어 있어서 페이지 별로 음성이 생성되며, E-Book 또는 초고화질 이미지에 더빙한 효과를 얻을 수 있습니다.

Features

고품질 보이스 콘텐츠 제작

  • 신경망 기반 AI TTS 음성을 이용하여 딱딱한 기계음이 아닌 실제 사람 목소리에 가까운 자연스러운 보이스 오디오를 생성해줍니다.
  • 생성되는 보이스 오디오가 DocZoom 뷰어의 페이지 이동과 연동되어 재생되므로 E-Book에 더빙한 효과를 얻을 수 있습니다.
  • 성별, 언어에 따른 수십 명의 AI 성우가 준비되어 있어서 E-Book 문서 내용 및 언어에 에 맞는 보이스 오디오를 생성할 수 있습니다.
  • 페이지 별 AI 성우 지정 및 한 페이지 내에서 여러 AI 성우를 함께 사용하는 것도 가능하여 자칫 지루해질 수 있는 보이스 오디오 콘텐츠에 생동감을 더할 수 있습니다.

다양한 웹 브라우저 및 장치 지원

  • IE11, Google Chrome, Safari, Firefox, Edge 등 다양한 웹 브라우저에서 보이스 재생이 지원됩니다.
  • 윈도우, Mac OS, Android, iOS 등 다양한 OS를 지원합니다.
  • PC, 태블릿, 스마트폰 등 다양한 화면크기/폼팩터를 지원합니다.

일반인/시각장애인용 E-Book+Audio 콘텐츠 제작

  • 음성 내레이션을 통한 시각장애인용 E-Book을 제작할 수 있습니다.
  • 일반인들을 위한 E-Book + 오디오북 콘텐츠를 제작할 수 있습니다.
  • 고화질 미술 작품 열람 시 오디오 내레이션이 제공되는 오디오북 콘텐츠를 제작할 수 있습니다.
  • 시각과 청각 콘텐츠를 함께 제공함으로써 콘텐츠의 완성도를 높일 수 있습니다.

다국어 콘텐츠 제작

  • 수십 개의 다양한 언어별 AI 성우를 사용할 수 있어서 각 언어별로 Native Speaker가 설명해주는 멀티미디어 콘텐츠를 제작할 수 있습니다.
  • 동일한 E-Book에 각 언어별 내레이션이 추가된 다국어 버전 E-Book을 생성하여 외국인 대상 특화 콘텐츠를 제작할 수 있습니다.
  • E-Book 한 페이지 안에 여러 언어의 음성을 함께 추가할 수 있어서 단일 E-Book 내에서 여러 언어의 내레이션을 차례로 들려줄 수 있습니다.

편리한 보이스 콘텐츠 제작

  • 웹 브라우저 상에서 작동하는 전용 온라인 DocZoom Voice 편집 화면이 제공되어, 텍스트 스크립트를 입력/편집한 후 버튼만 누르면 자동으로 E-Book과 연동되는 보이스 오디오 콘텐츠가 생성됩니다.
  • 각 E-Book 페이지 별로 텍스트 스크립트가 구분되어 표시되며, 다양한 편리 기능이 제공되므로 손쉽게 보이스 텍스트 스크립트를 입력하실 수 있습니다.
  • DocZoom 문서에서 자동으로 텍스트를 추출하여 각 페이지 별로 보이스 텍스트 스크립트를 자동으로 추가해주는 기능을 제공합니다.
  • 보이스 텍스트 편집 시 특정 부분만 선택하여 미리 들어볼 수 있는 기능이 제공되어 보다 빠르게 자연스러운 음성 결과물을 만들어낼 수 있습니다.


Case Study

  1. 멀티미디어 E-book 제작

    • 문서 내용과 보이스 오디오를 함께 제공하는 일반인 및 시각장애인용 멀티미디어 E-book을 제작할 수 있습니다.
  2. 미술관/박물관에서 온라인 소장 자료 열람 시 음성 나레이션 제공

    • DocZoom Streaming Server로부터 생성되는 초고화질 이미지 뷰어에 음성 나레이션을 추가하여 온라인 미술품/전시품 초고화질 이미지 서비스뿐만 아니라 현장 전시와 같은 음성 나레이션 서비스를 함께 제공할 수 있습니다.

    국립 현대미술관 소장품 검색
    국립 현대미술관 소장품 검색 방문하기
    (검색 조건에서 오디오 설명문을 체크하십시오)