Responsable

Mireia Farrús

Grupo de investigación

CLiC

Investigador principal

Maria Taulé Delor

Institución

Universitat de Barcelona

Tecnología para convertir texto a voz, adecuada para aplicaciones cuando el usuario tiene dificultades de lectura o de habla. Adaptada específicamente para el catalán y para entornos en los que la expresividad de la voz es un elemento relevante en la aplicación.

A diferencia de las soluciones basas en la nube, este sistema opera localmente, garantizando que los datos sensibles no se transmitan a través de internet. Utiliza arquitecturas neuronales profundas como el Tacotron2 y modelos basados en Transformers. Se puede entrenar con datos de un dominio específico y personalizar con la propia voz o con voces con un dialecto o acento específico.

La tecnología de síntesis automática de voz tiene un gran potencial en entornos de accesibilidad digital, ya que proporciona herramientas más precisas, naturales y seguras. Algunas aplicaciones específicas:

  • Lectores de pantalla,
  • Asistentes de voz para personas con discapacidades motoras,
  • Entrada predictiva de texto para personas con discapacidades motoras,
  • Aprendizaje adaptativo,
  • Adaptación a dialectos o acentos regionales.
Categoría
  • Tecnología
Área temática
  • Accesibilidad digital
  • Lectura fácil - Comunicación clara

Si quieres más información, ponte en contacto con nosotros.