구글 텍스트 음성 변환
| 파일:Google Text to Speech logo.svg | |
| 개발자 | 구글 |
|---|---|
| 발표일 | 2013년 11월 13일 |
| 안정화 버전 | 24.5.347911411
/ 2021년 1월 8일 |
| 저장소 |
|
| 엔진 | |
| 운영 체제 | 안드로이드 |
| 크기 | 약 37 MB |
| 종류 | 스크린 리더 |
구글 텍스트 음성 변환(Google Text-to-Speech)은 안드로이드 운영 체제용으로 구글이 개발한 스크린 리더 애플리케이션이다. 애플리케이션에 화면 상의 텍스트를 읽는 기능을 제공하며 수많은 언어를 지원한다. 텍스트 음성 변환은 책을 읽기 위해 구글 플레이 북 등의 앱에 사용이 가능하며 구글 번역의 경우 단어의 발음을 알 때 도움이 되는 번역을 제공한다. 구글 토크백과 기타 피드백 접근 애플리케이션과 서드파티 앱에도 사용된다. 사용자들은 이용을 위해 각 언어별 음성 데이터를 설치해야 한다.
지원 언어
- 아프리칸스어 (남아프리카 공화국)
- 알바니아어 (알바니아)
- 암하라어 (에티오피아)
- 아랍어 (사우디아라비아)
- 아삼어 (인도)
- 바스크어 (스페인)
- 벵골어 (방글라데시)
- 벵골어 (인도)
- 보도어 (인도)
- 보스니아어 (보스니아 헤르체고비나)
- 불가리아어 (불가리아)
- 버마어 (미얀마)
- 광둥어 (홍콩)
- 카탈루냐어 (스페인)
- 중국어 (중국)
- 중국어 (대만)
- 크로아티아어 (크로아티아)
- 체코어 (체코)
- 덴마크어 (덴마크)
- 도그리어 (인도)
- 네덜란드어 (벨기에)
- 네덜란드어 (네덜란드)
- 영어 (호주)
- 영어 (나이지리아)
- 영어 (인도)
- 영어 (영국)
- 영어 (미국)
- 에스토니아어 (에스토니아)
- 필리핀어 (필리핀)
- 핀란드어 (핀란드)
- 프랑스어 (캐나다)
- 프랑스어 (프랑스)
- 갈리시아어 (스페인)
- 독일어 (독일)
- 그리스어 (그리스)
- 구자라트어 (인도)
- 하우사어 (나이지리아)
- 히브리어 (이스라엘)
- 힌디어 (인도)
- 헝가리어 (헝가리)
- 아이슬란드어 (아이슬란드)
- 인도네시아어 (인도네시아)
- 이탈리아어 (이탈리아)
- 일본어 (일본)
- 자바어 (인도네시아)
- 칸나다어 (인도)
- 카슈미르어 (인도)
- 크메르어 (캄보디아)
- 콘칸어 (인도)
- 한국어 (대한민국)
- 라틴어 (바티칸 시국)
- 라트비아어 (라트비아)
- 리투아니아어 (리투아니아)
- 마이틸어 (인도)
- 말레이어 (말레이시아)
- 말라얄람어 (인도)
- 마니푸르어 (인도)
- 마라티어 (인도)
- 네팔어 (네팔)
- 노르웨이어 (노르웨이)
- 오디아어 (인도)
- 폴란드어 (폴란드)
- 포르투갈어 (브라질)
- 포르투갈어 (포르투갈)
- 펀자브어 (인도)
- 루마니아어 (루마니아)
- 러시아어 (러시아)
- 산스크리트어 (인도)
- 산탈리어 (인도)
- 세르비아어 (세르비아)
- 신디어 (인도)
- 신할라어 (스리랑카)
- 슬로바키아어 (슬로바키아)
- 슬로베니아어 (슬로베니아)
- 스페인어 (스페인)
- 스페인어 (미국)
- 순다어 (인도네시아)
- 스와힐리어 (케냐)
- 스웨덴어 (스웨덴)
- 타밀어 (인도)
- 텔루구어 (인도)
- 태국어 (태국)
- 튀르키예어 (튀르키예)
- 우크라이나어 (우크라이나)
- 우르두어 (파키스탄)
- 우르두어 (인도)
- 베트남어 (베트남)
- 웨일스어 (영국)
역사
일부 앱 개발자들은 2015년 현대자동차와 같이 안드로이드 오토 앱을 음성 합성 기능이 포함되도록 조정하고 수정하기 시작했다.[1] textPlus 및 WhatsApp과 같은 앱은 음성 합성을 사용하여 알림을 소리 내어 읽고 음성 답장 기능을 제공한다.
구글 클라우드 텍스트 음성 변환은 구글의 영국 기반 AI 자회사 딥마인드가 2014년 구글에 인수된 후 만든 소프트웨어인 웨이브넷[2]으로 구동된다.[3] 이 서비스는 경쟁사인 아마존과 마이크로소프트와 차별화하려고 한다.[4]
대부분의 음성 합성기(애플의 Siri 포함)는 프로그램이 개별 음소를 저장한 다음 이를 조합하여 단어와 문장을 형성하는 파형 연결형 음성 합성을 사용한다.[2] WaveNet은 음절, 음소 및 단어에 대한 인간과 유사한 강조와 억양으로 음성을 합성한다. 대부분의 다른 텍스트 음성 변환 시스템과 달리, WaveNet 모델은 처음부터 원시 오디오 파형을 생성한다. 이 모델은 대량의 음성 샘플을 사용하여 훈련된 신경망을 사용한다. 훈련 중 네트워크는 어떤 톤이 서로를 따르는지, 사실적인 음성 파형이 어떻게 보이는지와 같은 음성의 기본 구조를 추출한다. 텍스트 입력이 주어지면 훈련된 WaveNet 모델은 초당 최대 24,000개의 샘플과 개별 사운드 간의 부드러운 전환으로 처음부터 해당 음성 파형을 한 번에 하나씩 생성할 수 있다.[2]
이 서비스는 2023년에 음성 인식 및 합성으로 이름이 변경되었다.
같이 보기
각주
- ↑ “Google, Hyundai show off new third-party Android Auto apps”. 《CNET》. CBS Interactive. 2015년 1월 17일에 확인함.
- ↑ 가 나 다 “WaveNet” (영어). 《www.deepmind.com》. 2023년 6월 22일에 확인함.
- ↑ Gibbs, Samuel (2014년 1월 27일). “Google buys UK artificial intelligence startup Deepmind for £400m” (영국 영어). 《The Guardian》. ISSN 0261-3077. 2023년 6월 22일에 확인함.
- ↑ “Text-to-Speech AI: Lifelike Speech Synthesis” (영어). 《Google Cloud》. 2023년 6월 22일에 확인함.
- 스크립트 오류가 있는 문서
- CS1 - 영어 인용 (en)
- CS1 - 영국 영어 인용 (en)
- 잘못된 파일 링크가 포함된 문서
- 위키데이터 속성 P18을 사용하는 문서
- 위키데이터 속성 P41을 사용하는 문서
- 위키데이터 속성 P94를 사용하는 문서
- 위키데이터 속성 P117을 사용하는 문서
- 위키데이터 속성 P154를 사용하는 문서
- 위키데이터 속성 P213을 사용하는 문서
- 위키데이터 속성 P227을 사용하는 문서
- 위키데이터 속성 P242를 사용하는 문서
- 위키데이터 속성 P244를 사용하는 문서
- 위키데이터 속성 P245를 사용하는 문서
- 위키데이터 속성 P268을 사용하는 문서
- 위키데이터 속성 P269를 사용하는 문서
- 위키데이터 속성 P271을 사용하는 문서
- 위키데이터 속성 P347을 사용하는 문서
- 위키데이터 속성 P349를 사용하는 문서
- 위키데이터 속성 P350을 사용하는 문서
- 위키데이터 속성 P373을 사용하는 문서
- 위키데이터 속성 P380을 사용하는 문서
- 위키데이터 속성 P396을 사용하는 문서
- 위키데이터 속성 P409를 사용하는 문서
- 위키데이터 속성 P428을 사용하는 문서
- 위키데이터 속성 P434를 사용하는 문서
- 위키데이터 속성 P435를 사용하는 문서
- 위키데이터 속성 P436을 사용하는 문서
- 위키데이터 속성 P454를 사용하는 문서
- 위키데이터 속성 P496을 사용하는 문서
- 위키데이터 속성 P549를 사용하는 문서
- 위키데이터 속성 P650을 사용하는 문서
- 위키데이터 속성 P651을 사용하는 문서
- 위키데이터 속성 P691을 사용하는 문서
- 위키데이터 속성 P716을 사용하는 문서
- 위키데이터 속성 P781을 사용하는 문서
- 위키데이터 속성 P791을 사용하는 문서
- 위키데이터 속성 P864를 사용하는 문서
- 위키데이터 속성 P865를 사용하는 문서
- 위키데이터 속성 P886을 사용하는 문서
- 위키데이터 속성 P902를 사용하는 문서
- 위키데이터 속성 P906을 사용하는 문서
- 위키데이터 속성 P947을 사용하는 문서
- 위키데이터 속성 P950을 사용하는 문서
- 위키데이터 속성 P966을 사용하는 문서
- 위키데이터 속성 P982를 사용하는 문서
- 위키데이터 속성 P1003을 사용하는 문서
- 위키데이터 속성 P1004를 사용하는 문서
- 위키데이터 속성 P1005를 사용하는 문서
- 위키데이터 속성 P1006을 사용하는 문서
- 위키데이터 속성 P1015를 사용하는 문서
- 위키데이터 속성 P1045를 사용하는 문서
- 위키데이터 속성 P1048을 사용하는 문서
- 위키데이터 속성 P1053을 사용하는 문서
- 위키데이터 속성 P1146을 사용하는 문서
- 위키데이터 속성 P1153을 사용하는 문서
- 위키데이터 속성 P1157을 사용하는 문서
- 위키데이터 속성 P1186을 사용하는 문서
- 위키데이터 속성 P1225를 사용하는 문서
- 위키데이터 속성 P1248을 사용하는 문서
- 위키데이터 속성 P1273을 사용하는 문서
- 위키데이터 속성 P1315를 사용하는 문서
- 위키데이터 속성 P1323을 사용하는 문서
- 위키데이터 속성 P1330을 사용하는 문서
- 위키데이터 속성 P1362를 사용하는 문서
- 위키데이터 속성 P1368을 사용하는 문서
- 위키데이터 속성 P1375를 사용하는 문서
- 위키데이터 속성 P1407을 사용하는 문서
- 위키데이터 속성 P1556을 사용하는 문서
- 위키데이터 속성 P1584를 사용하는 문서
- 위키데이터 속성 P1695를 사용하는 문서
- 위키데이터 속성 P1707을 사용하는 문서
- 위키데이터 속성 P1736을 사용하는 문서
- 위키데이터 속성 P1886을 사용하는 문서
- 위키데이터 속성 P1890을 사용하는 문서
- 위키데이터 속성 P1907을 사용하는 문서
- 위키데이터 속성 P1908을 사용하는 문서
- 위키데이터 속성 P1960을 사용하는 문서
- 위키데이터 속성 P1986을 사용하는 문서
- 위키데이터 속성 P2041을 사용하는 문서
- 위키데이터 속성 P2163을 사용하는 문서
- 위키데이터 속성 P2174를 사용하는 문서
- 위키데이터 속성 P2268을 사용하는 문서
- 위키데이터 속성 P2349를 사용하는 문서
- 위키데이터 속성 P2418을 사용하는 문서
- 위키데이터 속성 P2456을 사용하는 문서
- 위키데이터 속성 P2484를 사용하는 문서
- 위키데이터 속성 P2558을 사용하는 문서
- 위키데이터 속성 P2750을 사용하는 문서
- 위키데이터 속성 P2980을 사용하는 문서
- 위키데이터 속성 P3223을 사용하는 문서
- 위키데이터 속성 P3233을 사용하는 문서
- 위키데이터 속성 P3348을 사용하는 문서
- 위키데이터 속성 P3372를 사용하는 문서
- 위키데이터 속성 P3407을 사용하는 문서
- 위키데이터 속성 P3430을 사용하는 문서
- 위키데이터 속성 P3544를 사용하는 문서
- 위키데이터 속성 P3562를 사용하는 문서
- 위키데이터 속성 P3563을 사용하는 문서
- 위키데이터 속성 P3601을 사용하는 문서
- 위키데이터 속성 P3723을 사용하는 문서
- 위키데이터 속성 P3788을 사용하는 문서
- 위키데이터 속성 P3829를 사용하는 문서
- 위키데이터 속성 P3863을 사용하는 문서
- 위키데이터 속성 P3920을 사용하는 문서
- 위키데이터 속성 P3993을 사용하는 문서
- 위키데이터 속성 P4038을 사용하는 문서
- 위키데이터 속성 P4055를 사용하는 문서
- 위키데이터 속성 P4114를 사용하는 문서
- 위키데이터 속성 P4143을 사용하는 문서
- 위키데이터 속성 P4186을 사용하는 문서
- 위키데이터 속성 P4423을 사용하는 문서
- 위키데이터 속성 P4457을 사용하는 문서
- 위키데이터 속성 P4534를 사용하는 문서
- 위키데이터 속성 P4535를 사용하는 문서
- 위키데이터 속성 P4581을 사용하는 문서
- 위키데이터 속성 P4613을 사용하는 문서
- 위키데이터 속성 P4955를 사용하는 문서
- 위키데이터 속성 P5034를 사용하는 문서
- 위키데이터 속성 P5226을 사용하는 문서
- 위키데이터 속성 P5288을 사용하는 문서
- 위키데이터 속성 P5302를 사용하는 문서
- 위키데이터 속성 P5321을 사용하는 문서
- 위키데이터 속성 P5368을 사용하는 문서
- 위키데이터 속성 P5504를 사용하는 문서
- 위키데이터 속성 P5587을 사용하는 문서
- 위키데이터 속성 P5736을 사용하는 문서
- 위키데이터 속성 P5818을 사용하는 문서
- 위키데이터 속성 P6213을 사용하는 문서
- 위키데이터 속성 P6734를 사용하는 문서
- 위키데이터 속성 P6792를 사용하는 문서
- 위키데이터 속성 P6804를 사용하는 문서
- 위키데이터 속성 P6829를 사용하는 문서
- 위키데이터 속성 P7293을 사용하는 문서
- 위키데이터 속성 P7303을 사용하는 문서
- 위키데이터 속성 P7314를 사용하는 문서
- 위키데이터 속성 P7902를 사용하는 문서
- 위키데이터 속성 P8034를 사용하는 문서
- 위키데이터 속성 P8189를 사용하는 문서
- 위키데이터 속성 P8381을 사용하는 문서
- 위키데이터 속성 P8671을 사용하는 문서
- 위키데이터 속성 P8980을 사용하는 문서
- 위키데이터 속성 P9070을 사용하는 문서
- 위키데이터 속성 P9692를 사용하는 문서
- 위키데이터 속성 P9725를 사용하는 문서
- 위키데이터 속성 P9984를 사용하는 문서
- 위키데이터 속성 P10020을 사용하는 문서
- 위키데이터 속성 P10299를 사용하는 문서
- 위키데이터 속성 P10608을 사용하는 문서
- 위키데이터 속성 P10832를 사용하는 문서
- 위키데이터 속성 P11249를 사용하는 문서
- 위키데이터 속성 P11646을 사용하는 문서
- 위키데이터 속성 P11729를 사용하는 문서
- 위키데이터 속성 P12204를 사용하는 문서
- 위키데이터 속성 P12362를 사용하는 문서
- 위키데이터 속성 P12754를 사용하는 문서
- 위키데이터 속성 P13049를 사용하는 문서
- 구글의 서비스
- 스크린 리더
- 2013년 개설된 인터넷 자산