Esta innovadora herramienta de IA es capaz de rescatar idiomas en peligro de extinción

Esta innovadora IA puede realizar traducciones automáticas basadas en reglas, asistidas por LLM, para idiomas con pocos o ningún recurso. Jared Coleman, quien recientemente obtuvo su doctorado en Ciencias de la Computación por la Universidad del Sur de California, y su profesor, el ingeniero Bhaskar Krishnamachari están utilizando la inteligencia artificial para revitalizar el paiute de Owens Valley, una lengua indígena en peligro de extinción.

Ambos comparten una pasión por los lenguajes, tanto humanos como informáticos.


Las interfaces cerebro-maquina continúan apareciendo en todo el mundo para auxiliar a personas con barreras en su comunicación.


Krishnamachari, originario de la India, creció hablando tamil, hindi e inglés, y más tarde en la universidad, aprendió francés y chino mandarín. Por su parte, Coleman, anglófono de nacimiento, se enamoró del español en la secundaria y aprendió portugués de su esposa y amigos en la universidad. Durante la pandemia, Coleman comenzó a tomar clases en línea de un idioma menos conocido: el paiute, del Valle de Owens. Como miembro de la tribu Big Pine Paiute del Valle de Owens, Coleman siente una profunda conexión con este idioma ancestral, hablado por su padre, David, quien creció en la reserva de la tribu en Big Pine, California.

“Soy nativo americano y el idioma nativo de mi tribu siempre me ha interesado. He tomado clases y demás, pero es muy difícil aprender un idioma en peligro de extinción porque no hay tantos recursos ni herramientas disponibles. Así que comencé a usar ChatGPT para preguntarle cosas sobre mi idioma, explorando lo que sabía y lo que no sabía sobre el idioma”, explica Jared Coleman, en entrevista con WIRED.

El enfoque de esta innovadora IA combina traductores basados en reglas con grandes modelos lingüísticos, proporcionando una herramienta práctica para su uso en el mundo real. “La herramienta es lo suficientemente inteligente, con algunas pistas, como para poder realizar gran parte de la traducción por sí sola”, explica Krishnamachari a esta revista.


article image

El Traductor de Google incorporó más de 110 idiomas de todo el mundo, incluyendo dialectos y lenguas de Latinoamérica, como: el K’iche’ y el Ta Yol Mam (Guatemala y México); el Náhuatl o Nahua, Maya, y el Zapoteco (México); el Q’eqchi (México y Bélice); y el Hunsrik (Brasil).


Jared Coleman se preguntó si los modelos de lenguaje de gran tamaño (LLM) como ChatGPT de OpenAI podrían ayudar a perfeccionar las habilidades del habla en idiomas en peligro de extinción. ChatGPT y otros LLM muestran un desempeño a nivel humano en muchas tareas de lenguaje natural en inglés debido a la abundancia de datos disponibles. Sin embargo, el paiute se considera un “idioma sin recursos”, lo que significa que no existen suficientes oraciones en paiute disponibles públicamente traducidas al inglés para entrenar un modelo de aprendizaje automático.

El ingeniero Bhaskar Krishnamachari, de la University of Southern California.

En su nuevo artículo académico, “Traducción automática basada en reglas asistida por LLM para idiomas con pocos o ningún recurso”, Coleman y Krishnamachari proponen un enfoque de traducción automática denominado LLM-RBMT (Traducción automática basada en reglas asistida por LLM) para ayudar a las personas a aprender idiomas sin recursos. Este enfoque combina herramientas de traducción basadas en reglas tradicionales con un modelo de lenguaje extenso (LLM) avanzado basado en lenguaje natural. En el método de los investigadores, el LLM no traduce directamente hacia o desde el paiute del Valle de Owens, sino que ayuda a guiar a los traductores basados en reglas, que se apoyan en reglas gramaticales y de vocabulario para realizar las traducciones entre idiomas. “Básicamente, el LLM actúa como un intermediario sofisticado, utilizando su comprensión avanzada del lenguaje para asegurarse de que el sistema basado en reglas produzca traducciones precisas,” explica Coleman.

(Esta entrevista ha sido ligeramente editada para facilitar su lectura)

Anna Lagos: ¿Qué les inspiró a centrarse en el uso de estos grandes modelos de lenguaje para la investigación de idiomas? ¿Cómo decidieron incluir este idioma en su investigación?

Esta información pertenece a su autor original y se encuentra disponible en: https://es.wired.com/articulos/esta-nueva-herramienta-de-ia-es-capaz-de-rescatar-idiomas-en-peligro-de-extincion

case studies

See More Case Studies

Contact us

Partner with Us for Comprehensive IT

We’re happy to answer any questions you may have and help you determine which of our services best fit your needs.

Your benefits:
What happens next?
1

We Schedule a call at your convenience 

2

We do a discovery and consulting meting 

3

We prepare a proposal 

Schedule a Free Consultation