euskalkultura.eus

diáspora y cultura vasca

Noticias rss

Un clic para convertir la voz en texto: Aditu transcribe automáticamente videos y audios en euskera o castellano

02/04/2020

PUBLICIDAD

La fundación Elhuyar, con sede en Usurbil (Gipuzkoa), ha creado y lanzado un reconocedor de voz que transcribe y subtitula automáticamente audios y vídeos en euskera y castellano. La tecnología de Aditu puede servir de base para introducir el euskera en dispositivos que permitan la interacción entre personas y máquinas. Jakes Goikoetxea firma en el diario Berria el reportaje que hemos condensado aquí para nuestras lectoras y lectores.

La entrevista que ha servido de base a este reportaje se podría haber transcrito a través de Aditu: se podía haber cogido el archivo de audio WMA generado por la grabadora, haberlo pasado a uno de los formatos de audio aceptados por Aditu, haberlo arrastrado del escritorio del ordenador al cuadro de la web de Aditu, haber solicitado su transcripción y ¡ya está!, convertida en texto la entrevista de 40 minutos mantenida con Igor Leturia. En un abrir y cerrar de ojos. Repasar el texto, escuchar por si acaso pasajes que susciten dudas y hubiera quedado listo para trabajar sobre él: cortar, pegar, quitar... Todo un chollo para los periodistas. Una labor que hubiera llevado dos o tres horas reducida prácticamente a un solo clic. Requisitos: un audio de cierta calidad y haberse realizado la entrevista en euskera batua...

Aditu es el reconocedor bilingüe del habla que ha creado Elhuyar Fundazioa. Es una plataforma que convierte audios y vídeos en euskera y castellano en texto en esas lenguas. Transcribe audios, transcribe y subtitula vídeos y archivos tanto de audio como de vídeo; o transcribe simultáneamente, en directo: si se habla al micrófono del móvil o del ordenador, transcribe lo dicho a tiempo real, como un dictado. La herramienta ofrece la posibilidad de crear subtítulos en eventos en directo. Y traducción combinada con traductor automático.

Aditu ha sido desarrollado por el departamento de tecnologías del habla de la Fundación Elhuyar, con Igor Leturia como responsable del departamento y de Aditu.

De fonemas a palabras

Aditu está basado en las redes neuronales y en la inteligencia artificial, al igual que diversos productos y servicios desarrollados en las tecnologías del lenguaje y el habla en los últimos años, como el Traductor del propio Elhuyar.

"Al final, lo que está detrás de las redes neuronales son operaciones matemáticas", explica Igor Leturia. "En parte, estos cálculos matemáticos imitan las señales eléctricas de nuestro cerebro".

Las redes neuronales se ven obligadas a entrenar, a aprender. Para eso se necesitan datos, muchos datos. Los ordenadores de antaño no podían procesar todos los datos necesarios; los actuales sí. "Hoy en día, han coincidido las tecnologías de las redes neuronales y las máquinas más potentes", resume Leturia. "Por un lado, se ha demostrado que las redes neuronales son muy adecuadas y eficaces para las tecnologías lingüísticas; por otro, los ordenadores actuales permiten entrenar a las redes neuronales con muchos más datos. Este tipo de tecnologías han dado un salto tremendo en poco tiempo ".

Aditu es un servicio de pago. El precio depende de las horas a transcribir. Sin embargo, quien quiera tiene la posibilidad de registrarse y probarlo gratuitamente.

(Resumido del texto original publicado en Berria)



« anterior
siguiente »

© 2014 - 2019 Basque Heritage Elkartea

Bera Bera 73
20009 Donostia / San Sebastián
Tel: (+34) 943 316170
Email: info@euskalkultura.eus

jaurlaritza gipuzkoa bizkaia