La tecnología de la inteligencia artificial puede ayudar a que las lenguas indígenas de México "permanezcan vivas, aunque sea de manera artificial, pues muchas de ellas carecen de hablantes”, dice Iván Vladimir Meza Ruiz, investigador del Instituto de Investigaciones en Matemáticas Aplicadas y en Sistemas (IIMAS) de la UNAM.
Para lograrlo sería necesario comenzar por la elaboración de un registro digital de las lenguas nacionales, aclaró el especialista en la sexta sesión de la Cátedra Extraordinaria de Bioética, organizada por el Programa Universitario de Bioética (PUB) de la UNAM.
En México existen 68 lenguas nacionales, agrupadas en 11 familias y que en conjunto tienen 364 variantes lingüísticas; muchas de las cuales están cayendo en desuso y se dirigen a la extinción, alertó el experto en un comunicado.
Te podría interesar
Del 15% de hablantes de nuestro país que había en 1930, la proporción disminuyó a 6.2% de la población nacional en 2020; además, quienes las utilizan son, en su mayoría, personas mayores, mientras que las generaciones más jóvenes casi no las practican, refirió.
Sin embargo, aclaró Meza Ruiz, se carece de datos masivos de las lenguas originarias de México, y señaló que la preservación de las lenguas por medio de la IA dependería de reunir suficiente información.
Además, reveló que en el proyecto se enfrentan a un dilema ético, pues en el entorno académico existe preferencia por la ciencia abierta y numerosas obras y documentos en estas lenguas están sujetas a autoría, tienen derechos morales y patrimoniales.
Preservación, no es sólo curiosidad
Meza Ruiz, quien hace investigación sobre deep learning del lenguaje y la traducción de lenguas indígenas, considera que una estrategia digital en el tema ayudaría a comunidades hablantes a tener acceso a salud, justicia, educación, autonomía económica y a una lectura y plática en sus lenguas.
También aclaró que, en nuestro país, muchas lenguas son únicamente orales y no escritas, por lo que existen menos registros.
“Los datos existentes están sesgados hacia la música y hay escasos registros del habla, la cual es además un punto de contacto para la discriminación”, señaló.
A decir del universitario, las lenguas originarias en nuestra nación no están bien representadas en términos de datos lingüísticos. El siguiente trabajo es crear el ecosistema para recolectarlos, y así poderlas conservar digitalmente.