본문으로 이동

구글 텍스트 음성 변환

한울위키, 우리 모두의 백과사전.
구글 음성 변환
개발자구글
발표일2013년 11월 13일(12년 전)(2013-11-13)
안정화 버전
24.5.347911411 / 2021년 1월 8일(5년 전)(2021-01-08)
저장소
  • {{URL|example.com|optional display text}}모듈:EditAtWikidata 29번째 줄에서 Lua 오류: attempt to index field 'wikibase' (a nil value).
엔진
    모듈:EditAtWikidata 29번째 줄에서 Lua 오류: attempt to index field 'wikibase' (a nil value).
    운영 체제안드로이드
    크기약 37 MB
    종류스크린 리더

    구글 텍스트 음성 변환(Google Text-to-Speech)은 안드로이드 운영 체제용으로 구글이 개발한 스크린 리더 애플리케이션이다. 애플리케이션에 화면 상의 텍스트를 읽는 기능을 제공하며 수많은 언어를 지원한다. 텍스트 음성 변환은 책을 읽기 위해 구글 플레이 북 등의 앱에 사용이 가능하며 구글 번역의 경우 단어의 발음을 알 때 도움이 되는 번역을 제공한다. 구글 토크백과 기타 피드백 접근 애플리케이션과 서드파티 앱에도 사용된다. 사용자들은 이용을 위해 각 언어별 음성 데이터를 설치해야 한다.

    지원 언어

    • 아프리칸스어 (남아프리카 공화국)
    • 알바니아어 (알바니아)
    • 암하라어 (에티오피아)
    • 아랍어 (사우디아라비아)
    • 아삼어 (인도)
    • 바스크어 (스페인)
    • 벵골어 (방글라데시)
    • 벵골어 (인도)
    • 보도어 (인도)
    • 보스니아어 (보스니아 헤르체고비나)
    • 불가리아어 (불가리아)
    • 버마어 (미얀마)
    • 광둥어 (홍콩)
    • 카탈루냐어 (스페인)
    • 중국어 (중국)
    • 중국어 (대만)
    • 크로아티아어 (크로아티아)
    • 체코어 (체코)
    • 덴마크어 (덴마크)
    • 도그리어 (인도)
    • 네덜란드어 (벨기에)
    • 네덜란드어 (네덜란드)
    • 영어 (호주)
    • 영어 (나이지리아)
    • 영어 (인도)
    • 영어 (영국)
    • 영어 (미국)
    • 에스토니아어 (에스토니아)
    • 필리핀어 (필리핀)
    • 핀란드어 (핀란드)
    • 프랑스어 (캐나다)
    • 프랑스어 (프랑스)
    • 갈리시아어 (스페인)
    • 독일어 (독일)
    • 그리스어 (그리스)
    • 구자라트어 (인도)
    • 하우사어 (나이지리아)
    • 히브리어 (이스라엘)
    • 힌디어 (인도)
    • 헝가리어 (헝가리)
    • 아이슬란드어 (아이슬란드)
    • 인도네시아어 (인도네시아)
    • 이탈리아어 (이탈리아)
    • 일본어 (일본)
    • 자바어 (인도네시아)
    • 칸나다어 (인도)
    • 카슈미르어 (인도)
    • 크메르어 (캄보디아)
    • 콘칸어 (인도)
    • 한국어 (대한민국)
    • 라틴어 (바티칸 시국)
    • 라트비아어 (라트비아)
    • 리투아니아어 (리투아니아)
    • 마이틸어 (인도)
    • 말레이어 (말레이시아)
    • 말라얄람어 (인도)
    • 마니푸르어 (인도)
    • 마라티어 (인도)
    • 네팔어 (네팔)
    • 노르웨이어 (노르웨이)
    • 오디아어 (인도)
    • 폴란드어 (폴란드)
    • 포르투갈어 (브라질)
    • 포르투갈어 (포르투갈)
    • 펀자브어 (인도)
    • 루마니아어 (루마니아)
    • 러시아어 (러시아)
    • 산스크리트어 (인도)
    • 산탈리어 (인도)
    • 세르비아어 (세르비아)
    • 신디어 (인도)
    • 신할라어 (스리랑카)
    • 슬로바키아어 (슬로바키아)
    • 슬로베니아어 (슬로베니아)
    • 스페인어 (스페인)
    • 스페인어 (미국)
    • 순다어 (인도네시아)
    • 스와힐리어 (케냐)
    • 스웨덴어 (스웨덴)
    • 타밀어 (인도)
    • 텔루구어 (인도)
    • 태국어 (태국)
    • 튀르키예어 (튀르키예)
    • 우크라이나어 (우크라이나)
    • 우르두어 (파키스탄)
    • 우르두어 (인도)
    • 베트남어 (베트남)
    • 웨일스어 (영국)

    역사

    일부 앱 개발자들은 2015년 현대자동차와 같이 안드로이드 오토 앱을 음성 합성 기능이 포함되도록 조정하고 수정하기 시작했다.[1] textPlus 및 WhatsApp과 같은 앱은 음성 합성을 사용하여 알림을 소리 내어 읽고 음성 답장 기능을 제공한다.

    구글 클라우드 텍스트 음성 변환은 구글의 영국 기반 AI 자회사 딥마인드가 2014년 구글에 인수된 후 만든 소프트웨어인 웨이브넷[2]으로 구동된다.[3] 이 서비스는 경쟁사인 아마존마이크로소프트와 차별화하려고 한다.[4]

    대부분의 음성 합성기(애플의 Siri 포함)는 프로그램이 개별 음소를 저장한 다음 이를 조합하여 단어와 문장을 형성하는 파형 연결형 음성 합성을 사용한다.[2] WaveNet은 음절, 음소 및 단어에 대한 인간과 유사한 강조와 억양으로 음성을 합성한다. 대부분의 다른 텍스트 음성 변환 시스템과 달리, WaveNet 모델은 처음부터 원시 오디오 파형을 생성한다. 이 모델은 대량의 음성 샘플을 사용하여 훈련된 신경망을 사용한다. 훈련 중 네트워크는 어떤 톤이 서로를 따르는지, 사실적인 음성 파형이 어떻게 보이는지와 같은 음성의 기본 구조를 추출한다. 텍스트 입력이 주어지면 훈련된 WaveNet 모델은 초당 최대 24,000개의 샘플과 개별 사운드 간의 부드러운 전환으로 처음부터 해당 음성 파형을 한 번에 하나씩 생성할 수 있다.[2]

    이 서비스는 2023년에 음성 인식 및 합성으로 이름이 변경되었다.

    같이 보기

    각주

    1. “Google, Hyundai show off new third-party Android Auto apps”. 《CNET》. CBS Interactive. 2015년 1월 17일에 확인함. 
    2. “WaveNet” (영어). 《www.deepmind.com》. 2023년 6월 22일에 확인함. 
    3. Gibbs, Samuel (2014년 1월 27일). “Google buys UK artificial intelligence startup Deepmind for £400m” (영국 영어). 《The Guardian》. ISSN 0261-3077. 2023년 6월 22일에 확인함. 
    4. “Text-to-Speech AI: Lifelike Speech Synthesis” (영어). 《Google Cloud》. 2023년 6월 22일에 확인함.