ESPECIAL: Latam GPT, el modelo de inteligencia artificial desarrollado en Chile para Latinoamérica y el Caribe

Por Xinhua | el 28 de febrero de 2025 | 10:13

Por Cristóbal Chávez Bravo

SANTIAGO, 27 feb (Xinhua) -- Chile está desarrollando un modelo de lenguaje llamado "Latam GPT", una herramienta de inteligencia artificial (IA) entrenada con el énfasis en datos de América Latina y el Caribe que será público, abierto e inclusivo, con fecha de lanzamiento proyectada para junio de este año.

"Latam GPT" es un modelo de lenguaje grande (LLM, por sus siglas en inglés) y se enmarca en un proyecto colaborativo coordinado desde el Centro Nacional de Inteligencia Artificial (Cenia) de Chile y está impulsado de manera conjunta por más de 30 instituciones, desde México, hasta la zona austral de Chile.

Uno de los lemas de este proyecto es "un modelo de lenguaje desarrollado en Latinoamérica para Latinoamérica".

"Básicamente, consiste en el desarrollo de un modelo de lenguaje entrenado principalmente con más énfasis de datos pertinentes de América Latina y el Caribe", explicó recientemente a Xinhua el gerente de Cenia, Rodrigo Durán.

El experto en inteligencia artificial explicó que han liderado un proceso de dos años en la recopilación de un conjunto de datos ("data set") que represente la cultura e idiosincrasia de América Latina y el Caribe. Este conjunto de datos estará disponible "para entrenar otros modelos de lenguajes, pero particularmente este va a estar entrenado por ese "data set" en específico".

"Modelos de inteligencia artificial en español existen, está el caso de Salamandra, el supercomputador de Barcelona que ya tiene casi un año de existencia, pero la virtud de esto es que los modelos de lenguaje conocen el mundo que está en el "data set" o en los datos con los cuales fueron entrenados", dijo Durán.

Desde el Gobierno chileno han señalado que los modelos de lenguaje actuales de inteligencia artificial, generados principalmente en el hemisferio norte, "se construyen con base en datos de entrenamiento, que no necesariamente reflejan la cultura, lenguaje e historia de Latinoamérica".

Es por ello que, según Durán, los datos que son más importantes, o que tienen mayor preponderancia dentro de los modelos más conocidos, son aquellos que provienen del norte global, "porque allá hay mayor disponibilidad, porque las empresas están ubicadas allá".

Por esta razón, destacó que la importancia de "Latam GPT" radica en que es capaz de interpretar y de reflejar de mejor manera "la cultura e idiosincrasia, las problemáticas y la visión de mundo que existe en América Latina y el Caribe".

"Además, nos permite desarrollar capacidades para entender de mejor forma y con mayor profundidad cómo funcionan y cuáles son los riesgos, los límites y las oportunidades que ofrecen estos modelos y tecnologías para el desarrollo de estos países", indicó.

Durán señaló que el entrenamiento de este modelo se realizará en un supercomputador de la Universidad de Tarapacá, en el norte de Chile.

"Es un modelo abierto, inclusivo" e indicó que estará disponible en una versión web para que se pueda utilizar e interactuar.

Desde 2023 Cenia ha trabajado en el establecimiento de alianzas con grupos de América Latina y el Caribe, entre ellas instituciones académicas, Gobiernos, bibliotecas, asociaciones y empresas que "tengan capacidades para contribuir al desarrollo de esto en los distintos procesos que implican", dijo Durán.

Profundizó que desarrollar un modelo implica una serie de pasos fundamentales, que incluyen la recolección, etiquetado y curaduría de los datos.

"Después está el desarrollo en el pre entrenamiento, entrenamiento, alineamiento del modelo y en cada una de esas etapas tenemos equipos multidisciplinarios provenientes de universidades, centros de estudios, de comunidades de investigación y de desarrollo que están en América Latina y el Caribe para poder robustecer y mejorar la capacidad técnica de la solución que estamos haciendo hoy", añadió.

A mediados de febrero, la ministra de Ciencia, Tecnología, Conocimiento e Innovación de Chile, Aisén Etcheverry, aseveró que Latam GPT será público, abierto e inclusivo y proyectan que esté disponible en junio de 2025.

"Es un esfuerzo colaborativo con Cenia, donde participan más de 30 instituciones de toda Latinoamérica y el Caribe. Es un esfuerzo colectivo, abierto y reflejo de lo que esperamos sea este modelo de lenguaje", indicó.

En 2021, el país sudamericano publicó su Política Nacional de Inteligencia Artificial (IA); junto con esta iniciativa, creó el Cenia, implementó las redes 5G y lanzó el primer doctorado en IA de Latinoamérica, entre otras medidas que posicionan al país en el primer lugar de la región en el Índice Latinoamericano de IA, según datos del Cenia.

(Web editor: 周雨, Zhao Jian)