Responsable

Mireia Farrús

Grup de recerca

CLiC

Investigador principal

Maria Taulé Delor

Institució

Universitat de Barcelona

Tecnologia per a convertir text a veu, adequada per a aplicacions on l'usuari té dificultats de lectura o de parla. Adaptada específicament per al català i per a entorns on l'expressivitat de la veu és un element rellevant en l'aplicació.

A diferència de les solucions basades en el núvol, aquest sistema opera localment, garantint que les dades sensibles no es transmetin a través d'Internet. Utilitza arquitectures neuronals profundes com el Tacotron2 i models basats en Transformers. Es pot entrenar amb dades d’un domini específic i personalitzar amb la pròpia veu o amb veus d’un dialecte o accent específic.

La tecnologia de síntesi automàtica de veu té un gran potencial en entorns d'accessibilitat digital, ja que proporciona eines més precises, naturals i segures. Algunes aplicacions específiques:

  • Lectors de pantalla,
  • Assistents de veu per a persones amb discapacitats motores,
  • Entrada predictiva de text per a persones amb discapacitats motores,
  • Aprenentatge adaptatiu,
  • Adaptació a dialectes o accents regionals.
Categoria
  • Tecnologia
Àrea temàtica
  • Accessibilitat digital
  • Lectura fàcil – Comunicació clara

Si vols més informació, posa't en contacte amb nosaltres.