
Chatgpt, Géminis, Claude, Llama, Deepseek. Hoy hay docenas de modelos de conversación disponibles para cualquier persona. Algunos son abiertos, otros gratis. Entonces, ¿por qué México decidió crear el suyo? ¿Qué puede contribuir un modelo nacional que los gigantes de Silicon Valley, Europa o Beijing no contribuyan? La respuesta tiene menos que ver con la tecnología y más con la cultura.
México ha anunciado El desarrollo de su propio modelo de lenguaje de inteligencia artificial con identidad cultural mexicana e inclusión de lenguas indígenas.
Cuando AI no entiende todo. Los modelos más conocidos de hoy son poderosos y versátiles, pero no fueron diseñados para comprender la diversidad lingüística y cultural de todos los países. Sus datos de capacitación priorizan el inglés y, aunque muchos otros idiomas, como el español, hablan, el pecado de baja sensibilidad a las expresiones locales o los idiomas originales.
Un estudio reciente de IDB Lab, Llyc y Microsoft Muestra que solo el 54% de las respuestas en lenguas indígenas eran correctas (el 46% restante presentaba errores o mezclas de idiomas). En particular, en Maya y Quiché, la comprensión y la expresión apenas alcanzaron 1.25/10, mientras que en Nahuatl fue 3.42/10 y en Guaraní 2.77/10
¿Qué dijo el gobierno mexicano?. El Secretario de Economía, Marcelo Ebrard, anunció que México presentará en noviembre (12 y 13, Expo Santa Fe, CDMX) Los avances en su propio idioma durante el foro «México IA + Acelerado de Inversión». «Si no nos apresuramos a dominar ese alfabeto, enfrentaremos una desventaja muy significativa en este nuevo contexto que está emergiendo hoy», dicho.
¿Quién lo hace y cuánto cuesta?. El Ministerio de Economía, bajo la dirección de Marcelo Ebrard, dirige la iniciativa del Consejo de Coordinación de Negocios (CCE) y con el apoyo tecnológico de NVIDIA, que proporcionará capacitación y hardware sin invertir capital en el proyecto. Según el CCE, la construcción de los centros de datos requerirá una inversión aproximada de 9,000 millones de dólares.
¿Cómo será el modelo?. El modelo planea entrenar con datos culturales de México, español mexicano y lenguas indígenas activas. México reconoce 68 grupos lingüísticos y 364 variantes (INALI), Force Corpus’s Fine Collection and Healing Work.
¿Qué están haciendo otros países?. En América Latina, una coalición de países lanzará Latam-GPT en septiembre de 2025, dirigida por Cenia (Chile) con el apoyo de más de 30 instituciones. Nace para representar la diversidad cultural y lingüística regional y las funciones como un proyecto de colaboración regional. En Europa, España promueve Alia, una infraestructura pública de modelos en español y en idiomas coficienciales.
Imágenes | con Géminis 2.5 Flash
En | El Instituto Electoral de México utilizó una voz sintética como la del narrador de Ball Dragon. Los actores salieron