El auge de herramientas de IA como ChatGPT y Google Bard ha brindado la oportunidad perfecta para dar saltos significativos en proyectos de habla multilingüe, haciendo avanzar la tecnología lingüística y promoviendo la diversidad lingüística en todo el mundo.
Meta ha aceptado el reto y ha presentado su último modelo lingüístico de IA, capaz de reconocer y generar habla en más de 4.000 idiomas.
El habla multilingüe masiva (MMS) significa que la nueva IA de Meta no es una mera réplica de ChatGPT. El modelo utiliza fuentes de datos no convencionales para superar las barreras del habla y permitir que las personas se comuniquen en su lengua materna sin pasar por un exhaustivo proceso de traducción.
Y lo que es más emocionante, Meta ha hecho que MMS sea de código abierto, invitando a los investigadores a aprender de la base que proporciona y a ampliarla. Este movimiento sugiere que la empresa está firmemente decidida a dominar el espacio de la traducción automática de idiomas, pero también fomenta la colaboración en este campo.
Más idiomas en la conversación
Normalmente, los programas de inteligencia artificial de reconocimiento de voz y conversión de texto a voz necesitan una formación exhaustiva sobre un gran número de conjuntos de datos de audio, combinada con meticulosas etiquetas de transcripción. Muchas lenguas en peligro de extinción que se encuentran fuera de los países industrializados carecen de este tipo de bases de datos, por lo que corren el riesgo de desaparecer o quedar excluidas de las herramientas de traducción.
Según Gizmochina, Meta adoptó un enfoque interesante en esta cuestión y se sumergió en textos religiosos. Estos textos proporcionan diversas interpretaciones lingüísticas que permiten a Meta obtener una visión «en bruto» y sin explotar de lenguas menos conocidas para la investigación basada en textos.
La publicación de MMS como recurso de código abierto y proyecto de investigación demuestra que Meta está dedicando mucho tiempo y esfuerzo a la falta de diversidad lingüística en el campo de la tecnología, que con frecuencia se limita a las lenguas más habladas.
Se trata de un avance apasionante en el mundo de la IA, que podría acercarnos mucho más al tipo de «traductores universales» que actualmente sólo existen en la ciencia ficción. Imagina unos auriculares que, gracias a la IA, no sólo te traduzcan en tiempo real lo que hablas en otro idioma, sino que además filtren el idioma original para que sólo oigas tu lengua materna.
A medida que más investigadores trabajen con el MMS de Meta y se incluyan más idiomas, podríamos ver un mundo en el que la tecnología de asistencia y la conversión de texto a voz nos permitirían hablar con la gente independientemente de su lengua materna, compartiendo información mucho más rápido. Como persona que intenta aprender un idioma, estoy muy ilusionada con este desarrollo, ya que facilitará mucho la práctica de la conversación en la vida real y ayudará a familiarizarse con palabras y frases informales y coloquiales que sólo los hablantes nativos conocen.