Meta

Meta trabaja en una tecnología basada en IA y capaz de traducir lenguas no escritas

Meta ha asegurado que esta tecnología puede ser capaz de traducir idiomas que no disponen de una gramática y una ortografía oficial, es decir, lenguas no escritas.

El logo de la empresa 'Meta'EFE

Meta ha asegurado que está desarrollando una tecnología basada en Inteligencia Artificial (IA) que sea capaz de traducir idiomas que no disponen de una gramática y una ortografía oficial, es decir, lenguas no escritas. La compañía ha hecho un adelanto del desarrollo de su proyecto Universal Speech Translator (UST), con el que busca crear un modelo de traducción en tiempo real en todos los idiomas existentes, para "romper barreras y unir a las personas", según ha indicado en un comunicado.

Este proyecto, que se centra en fomentar la comunicación hablada en diferentes escenarios, tanto en el mundo real como en el metaverso, contempla dar soporte a todos los idiomas.

Por su parte, Meta ha comentado que la traducción mediante IA "se ha centrado principalmente en las lenguas escritas" y ha reconocido que existen más de 7.000 idiomas vivos en todo el mundo de los cuales cerca de la mitad "no disponen de un sistema de escritura estándar o ampliamente utilizado".

Asimismo, ha reiterado que es consciente de ese vacío existente debido a que los modelos de aprendizaje automáticos precisan de mayor información para desarrollar una traducción simultánea. Por ejemplo, gramática y ortografía.

El primer sistema de traducción para una lengua

Para hacer frente a este reto, ha creado su primer sistema de traducción para una lengua principalmente oral, como es el hokkien. Esta carece de una forma escrita estándar, por lo que inicialmente no se podría traducir mediante sus estándares de IA.

Para trabajar en este proyecto, la compañía señala que la recopilación de datos "fue un obstáculo importante", principalmente porque no tenía información suficiente para crear modelos de ‘machine leargning’. Para dar solución a esta falta de información, Meta aprovechó el chino mandarín como lengua intermedia para construir traducciones relativamente fieles. En primer lugar, tradujo el habla hokkien a texto mandarín. Como consecuencia de este paso intermedio, el resultado de la traducción mejoró al tomar como referencia los datos de un idioma similar.

Posteriormente, mediante un modelo de entrenamiento, se analizó la semántica y la oratoria de esta lengua y se comparó con otras lenguas que sí disponen de un formato escrito, como el inglés. Después, sintetizó la lengua inglesa a partir de textos escritos y originó una lengua paralela entre el hokkien y el inglés.

Un sistema de voz a voz

La compañía ha recordado que buena parte de los sistemas de traducción se basan en transcripciones de voz a texto y ha reformulado este concepto para analizar las transcripciones de voz a voz.

Asimismo, ha asegurado que este proyecto se puede extender a más lenguas, aparte del hokkien y, por ello, ha anunciado que va a publicar un corpus de traducciones de voz a voz llamado SpeechMatrix, que ha extraído de su herramienta de representaciones de oraciones agnósticas del lenguaje.

Más sobre este tema: