Casa Desenvolupament Què és de text a discurs (tts)? - Definició de tecnologia

Què és de text a discurs (tts)? - Definició de tecnologia

Taula de continguts:

Anonim

Definició: què significa Text to Speech (TTS)?

Text to speech (TTS) és un procés de modelatge del llenguatge natural que requereix canviar unitats de text en unitats de parla per a la presentació d'àudio. És el contrari de la parla al text, on una tecnologia pren paraules pronunciades i intenta registrar-les amb precisió com a text. El text a veu ara és habitual en tecnologies que busquen generar una sortida d'àudio a partir de text digital per ajudar aquells que no poden llegir o per a altres tipus d'ús.

Techopedia explica Text to Speech (TTS)

El desenvolupament de la capacitat de text a veu inclou alguns reptes únics. Especialment en anglès, on un gran nombre d’homònims tenen pronunciacions variades, els programes informàtics es basen en el model de probabilitats per endevinar la pronunciació desitjada d’una paraula en un text digital. El programa també ha de convertir les unitats de text en fonemes, les unitats més petites de pronunciació de la parla. El resultat és que moltes tecnologies de text a veu són menys que infal·libles, tot i que els desenvolupadors han fet progressos importants en aquestes tecnologies al llarg de diversos anys.


Al llarg del temps, els experts han observat algunes bones pràctiques per al desenvolupament de TTS. Aquests inclouen bases fonètiques i enfocaments concatenatius amb analítica predictiu. Els millors programes també poden treballar amb mínims requisits de memòria i són fàcils de configurar. Els desenvolupadors continuen treballant amb recursos TTS per a qualsevol idioma determinat, treballant a través dels principals reptes de l’ambigüitat i d’altres obstacles per a una representació més precisa.

Què és de text a discurs (tts)? - Definició de tecnologia