AccessCat | SCRIBAL

Responsable

Mireia Farrús

Grup de recerca

CLiC

Investigador principal

Maria Taulé Delor

Institució

Universitat de Barcelona

Tecnologia per a convertir veu a text, adequada per a aplicacions on la privacitat és crítica o quan es requereix un rendiment d’alt nivell en un domini específic.

A diferència de les solucions basades en el núvol, aquest sistema opera localment, garantint que les dades sensibles no es transmetin a través d'Internet. Utilitza arquitectures neuronals profundes com el Whisper (actualment), Wav2Vec o DeepSpeech per a la transcripció. Es pot entrenar amb dades d’un domini específic i personalitzar amb la pròpia veu o amb veus d’un dialecte o accent específic. A més a més, conté un mòdul adaptat a persones amb parla no fluïda (síndrome de Down i paràlisi cerebral).

La tecnologia de transcripció de veu de domini específic té un gran potencial en entorns d'accessibilitat digital, ja que proporciona eines més precises, naturals i segures. Algunes aplicacions específiques:

Assistents de veu per a persones amb discapacitats motores
Aplicacions de transcripció per a persones sordes o amb problemes d'audició
Entrada predictiva de text per a persones amb discapacitats motores
Aprenentatge adaptatiu
Adaptació a dialectes o accents regionals

Podeu veure la tecnologia en funcionament a Les demos d'AccessCat.

Categoria

Tecnologia

Àrea temàtica

Lectura fàcil – Comunicació clara
Accessibilitat digital

Si vols més informació, posa't en contacte amb nosaltres indicant-nos com a referència "SCRIBAL".