AccessCat | Tecnología de síntesis automática del habla

Responsable

Mireia Farrús

Grupo de investigación

CLiC

Investigador principal

Maria Taulé Delor

Institución

Universitat de Barcelona

Tecnología para convertir texto a voz, adecuada para aplicaciones cuando el usuario tiene dificultades de lectura o de habla. Adaptada específicamente para el catalán y para entornos en los que la expresividad de la voz es un elemento relevante en la aplicación.

A diferencia de las soluciones basas en la nube, este sistema opera localmente, garantizando que los datos sensibles no se transmitan a través de internet. Utiliza arquitecturas neuronales profundas como el Tacotron2 y modelos basados en Transformers. Se puede entrenar con datos de un dominio específico y personalizar con la propia voz o con voces con un dialecto o acento específico.

La tecnología de síntesis automática de voz tiene un gran potencial en entornos de accesibilidad digital, ya que proporciona herramientas más precisas, naturales y seguras. Algunas aplicaciones específicas:

Lectores de pantalla,
Asistentes de voz para personas con discapacidades motoras,
Entrada predictiva de texto para personas con discapacidades motoras,
Aprendizaje adaptativo,
Adaptación a dialectos o acentos regionales.

Categoría

Tecnología

Área temática

Accesibilidad digital
Lectura fácil - Comunicación clara

Si quieres más información, ponte en contacto con nosotros indicando la referencia "Tecnología de síntesis automática del habla".