Taula de continguts:
Definició: què significa síntesi de veu?
La síntesi de parla és una simulació artificial de la parla humana amb un ordinador o un altre dispositiu. La contrapart del reconeixement de veu, la síntesi de veu s’utilitza principalment per traduir informació de text a informació d’àudio i en aplicacions com ara serveis habilitats per a veu i aplicacions mòbils. A part d'això, també s'utilitza en tecnologia assistencial per ajudar a persones amb problemes de visió a llegir contingut de text.
Techopedia explica la síntesi del discurs
El VODER d’Homer Dudley, basat en el vocoder de Bell Laboratories, es considera el primer sintetitzador de veu totalment funcional. L’ordinador que s’utilitza en la síntesi de parla és conegut com a sintetitzador de veu o ordinador de parla. Sovint es jutja la qualitat de l'ordinador de veu per la seva similitud amb la veu humana. La majoria dels sistemes operatius d’ordinadors han incorporat sintetitzadors de veu des de principis dels anys 90. El discurs sintetitzat es genera generalment amb l'ajuda de concatenar peces de discurs enregistrades, que es troba en una base de dades.
L’etapa inicial en la síntesi de la parla és el preprocessament, que elimina l’ambigüitat que envolta la forma en què cal llegir la paraula específica, i que també inclou el maneig d’homografies. En la següent etapa de síntesi de parla, l’ordinador ajuda l’ajuda dels fonemes per convertir el text en seqüència de sons. L’última etapa consisteix en l’ús d’enregistraments humans o tècniques bàsiques de generació de so per imitar el mecanisme de veu humana i llegir tot el text. Una de les branques més populars de la síntesi de la parla és la síntesi de la veu audiovisual o la síntesi del discurs multimodal que fa ús d'una cara animada estretament sincronitzada per complementar el discurs sintetitzat. La síntesi de parla multimodal també incorpora funcions addicionals com ara indicis no verbals al discurs per ajudar a comunicar les paraules de l’usuari amb més precisió. Molts sistemes de síntesi de veu permeten als usuaris triar el tipus de veu, com ara la veu masculina o femenina.
La majoria de sistemes de síntesi de veu són capaços de llegir textos i emetre'ls d'una manera molt intel·ligent, tot i que la veu a vegades pot ser sorda. Tanmateix, la síntesi de parla encara ha de desenvolupar la capacitat d'imitar completament l'ampli espectre d'entonacions i cadències humanes.
