octubre 1, 2022

Noticias México.NET

Noticias que sí necesitas

Inteligencia Artificial y Tecnologías de la Información de punta, más que nunca en IPN

4 minutos de lectura

Ciudad de México a 17 de mayo de 2022.- El Instituto Politécnico Nacional (IPN) se coloca nuevamente a la vanguardia en el desarrollo de la Inteligencia Artificial y Tecnologías de la Información mediante INDLEX (Indigenous lexicon), que es la  aplicación móvil  para el registro de las lenguas indígenas mexicanas que aportará profundos impactos sociales  para el uso y preservación de este acervo nacional. 

El desarrollo de este proyecto que se encuentra a cargo de alumnos pertenecientes al Laboratorio de Lenguaje Natural y Procesamiento de Texto, del Centro de Investigación en Computación (CIC) el cual  innovará en el uso de las tecnologías por su aplicación en la recolección y documentación sistematizada de las lenguas indígenas mexicanas en sus versiones vivas. 

Christian Efraín Maldonado Sifuentes, responsable técnico del equipo, comentó que “INDLEX brindará, opciones para tomar fotos, subir imágenes representativas del vocablo traducido, así como la oportunidad de grabar audios propios con la pronunciación de cada palabra y hacer seguimiento de la evolución de los alfabetos. Los investigadores de campo tendrán métodos de trabajo más efectivos y modernos para interactuar con las comunidades de hablantes, sistematizar y compartir vocabularios con el resto de la comunidad científica”. 

Existen 68 lenguas indígenas en México que suman más de 7 millones de hablantes y 25 millones de personas que se identifican con dichos grupos lingüísticos aún sin hablar la lengua. Así mismo, las lenguas indígenas han sido reconocidas por la UNESCO como “herencia insustituible para la humanidad y […] un patrimonio invaluable para la sociedad [1]”. Debido a falta de mecanismos efectivos para su documentación, estas lenguas se encuentran en declive y alto riesgo de extinción. 

“En este proyecto utilizaremos técnicas de programación novedosas que permitan brindar a los hablantes bilingües –indígena/español–, una manera sencilla y rápida de registrar traducciones, y realizar anotaciones de multimedia en su lengua y variante indígena. La información recolectada por INDLEX servirá a investigadores de humanidades y de inteligencia artificial que requieran mayores recursos léxicos y desarrollar tecnologías del lenguaje en beneficio de las comunidades indígenas de México, explicó Christian Efraín Maldonado Sifuentes.

En el mundo existen cerca de 7000 lenguas habladas y se estima que la mitad están en peligro de desaparecer en el transcurso de este siglo. Por ello se han desarrollado esfuerzos como los de Broadwell et al, 2020 y Harrison et al 2019, para el rescate de las lenguas en peligro de desaparecer. 

Christian Efraín Maldonado Sifuentes precisó que existen iniciativas de otros países, tales como living dictionaries o living tongues con tecnologías para la documentación sistemática de lenguas, “sin embargo en México carecemos de ello aún y queda en evidencia en los repositorios de talking dictionaries, living dictionaries, qué son las tecnologías extranjeras las tienen mayor disponibilidad de recursos lingüísticos de lenguas indígenas mexicanas que las que tenemos en nuestros sistemas nacionales, y mientras nuestras lenguas originarias siguen a la espera de mayor atención tecnológica para el rescate de este importante patrimonio nacional”.

La aplicación INDLEX busca simplificar la recolección de traducciones de palabras y recursos multimedia representados en múltiples lenguas indígenas de México y sus más de 360 variantes lingüísticas. Permitirá interfaz sencilla y amigable para ser usada por cualquier persona bilingüe (indígena/español); operar en condiciones de baja conectividad, o utilizar la app sin conexión a internet empleando tecnología de sincronización de datos; Implementar una base de datos abierta que almacene múltiples traducciones de cada vocablo por lengua y variante, permitiendo la expresión natural de los hablantes; desarrollar un sistema multi-usuario para que diversos hablantes puedan trabajar con un solo dispositivo. Asimismo, fácil acceso a los datos para que investigadores de diferentes áreas y disciplinas puedan hacer uso de los mismos con fines académicos y de preservación de lenguas.

En el equipo, cuyo co-responsable técnico es el Dr. Grigori Sidorov, del  Centro de Investigación en Computación del IPN, participan los alumnos Jason Efrain Angel Gil, José Eduardo Valdés Rojas, José Ricardo Jimenez Yáñez, Alain Pacchiano Alemán, Sergio Gabriel Sánchez Valencia, Christen Danae Maldonado Ortega. Han participado como autores, co-organizadores y asistentes en prestigiosos congresos internacionales de la inteligencia artificial, y el procesamiento de datos donde se resaltan las aplicaciones a comunidades de lenguas  entre las que destacan  AmericasNLP y la Escuela de verano de NAACL. Así mismo, son organizadores del 2do. congreso de Procesamiento de Lenguaje Natural para Lenguas Indígenas (PLN Indígenas), colaboradores en la asociación de  NLP for Social Good y fundadores de AMNLP, asociación que busca el avance de las minorías mediante el procesamiento de lenguaje natural. Tiene una colaboración cercana con el equipo de activistas, investigadores, y desarrolladores de Miyotl, una comunidad de programadores y hablantes de lenguas indígenas que desarrollan un App para la preservación de estas lenguas y ha causado un gran impacto en diversas partes del mundo con más de 30,000 descargas y 2,500 usuarios activos diariamente.

Deja un comentario