


Imagine una IA que no sólo responda preguntas, sino que pueda imaginar escenarios, predecir consecuencias o planificar acciones antes de ejecutarlas. Esto es precisamente lo que prometen los modelos mundiales, una tecnología que esta llamando la atencion de los principales laboratorios de inteligencia artificial y que podría cambiar radicalmente cómo las máquinas entienden e interactúan con su entorno.
¿Qué son exactamente?. Los modelos mundiales son sistemas de inteligencia artificial que construyen una representación interna del entorno, como si contuvieran una simulación del mundo real. A diferencia del aprendizaje supervisado tradicional, que simplemente asigna entradas a salidas utilizando datos etiquetados, estos modelos aprender cómo funciona un entorno y pueden predecir lo que sucederá a continuación. Es similar a cómo los humanos usan simulaciones mentales para anticipar resultados sin necesidad de experimentar físicamente cada situación.
El ejemplo del bateador. Los investigadores David Ha y Jürgen Schmidhuber ellos lo explican Con una analogía deportiva: un bateador de béisbol tiene apenas milisegundos para decidir cómo golpear la pelota, menos tiempo del que tarda la señal visual en llegar al cerebro. Lo que le permite batear una bola rápida a 100 millas por hora es su capacidad para predecir instintivamente hacia dónde irá la bola. Tus músculos reaccionan reflexivamente en función de las predicciones de tu modelo mental interno, sin necesidad de planificar conscientemente todos los escenarios posibles.
¿Por qué son importantes ahora?. Figuras destacadas como Yann LeCun (Meta), Demis Hassabis (Google DeepMind) y Yoshua Bengio (Quebec AI Institute) considerar que estos modelos son esenciales para construir sistemas verdaderamente inteligentes. La startup World Labs de Fei-Fei Li, una de las figuras más influyentes en IA, levantado el año pasado 230 millones de dólares para desarrollarlos.
Por otro lado, General Intuition, un nuevo laboratorio de IA propiedad de Medal (conocida por su aplicación para grabar y compartir clips de juegos), Acabo de recibir una ronda de financiación de 133,7 millones. La inversión provino principalmente del fundador de Khosla Ventures, Vinod Khosla (uno de los primeros inversores de OpenAI), quien afirma que «en este ámbito se crearán múltiples empresas valoradas en cientos de miles de millones, potencialmente incluso billones de dólares».
como funcionan. Estos sistemas tienen tres capacidades fundamentales. Por un lado, comprimen datos sensoriales complejos (imágenes, vídeos, texto) en representaciones más simples. En segundo lugar, predicen estados futuros del medio ambiente basándose en información pasada y presente. En tercer lugar, utilizan ese modelo aprendido para simular diferentes acciones y elegir la mejor opción. Es como si la IA pudiera «soñar» diferentes escenarios antes de actuar.
El caso de los videojuegos. Ha y Schmidhuber también tienen un ejemplo aclaratorio Para hacer esto: imagina una IA aprendiendo a jugar un juego de carreras. En lugar de memorizar secuencias de movimientos, primero construyes un modelo interno de cómo se comporta el mundo del juego: cómo se mueve el coche, cómo se curva la carretera, dónde aparecen los obstáculos. Luego podrás imaginar escenarios futuros, probando diferentes estrategias de conducción en tu mundo simulado antes de aplicarlas en el juego real.
Aplicaciones prometedoras. modelos mundiales Ya están transformando varios campos. En la conducción autónoma, permiten que los vehículos simulen la dinámica del tráfico y el comportamiento de los peatones para tomar decisiones más seguras. En robótica, los robots pueden imaginar diferentes formas de completar una tarea antes de ejecutarla, lo que resulta especialmente útil cuando el entrenamiento en el mundo real es costoso o peligroso. Y en la generación de video, ayudar a crear contenido más realista: Un modelo que entienda por qué rebota una pelota lo va a representar mejor que uno que simplemente haya memorizado patrones.
Más allá del vídeo. Un mejor modelo de generación de vídeo sería sólo el comienzo. lecun describir Cómo un modelo mundial podría ayudar a lograr objetivos a través del razonamiento: dado un vídeo de una habitación desordenada y el objetivo de limpiarla, podrías idear una secuencia de acciones (aspirar, limpiar los platos, vaciar la basura) no porque hayas observado ese patrón, sino porque entiendes en un nivel más profundo cómo pasar de lo sucio a lo limpio. «Necesitamos máquinas que comprendan el mundo, que puedan recordar cosas, que tengan intuición y sentido común». afirma.
Los obstáculos por delante. Entrena y ejecuta modelos del mundo. requiere una enorme potencia informáticaincluso en comparación con los modelos generativos actuales. Aunque ya se necesitan miles y miles de GPU enclaustradas en gigantescos centros de datos que consumen una tonelada de energía para ejecutar los modelos actuales, entrenar modelos mundiales es otro nivel. Además, como todos los modelos de IA, también corren el riesgo de alucinar e internalizar sesgos en sus datos de entrenamiento.
La apuesta de la industria. A pesar de los desafíos técnicos, existen diferentes estrategias. Google DeepMind y OpenAI ellos apuestan porque con suficientes datos de entrenamiento multimodal (vídeo, simulaciones 3D y más allá del texto) surgirá espontáneamente un modelo mundial dentro de una red neuronal. LeCun, por su parte, creer que será necesaria una arquitectura de IA no generativa completamente nueva.
¿Qué viene después?. Varios expertos también predicen que los modelos mundiales te permitirá crear mundos interactivos en 3D bajo demanda para videojuegos, fotografía virtual y otras aplicaciones. De acuerdo a Justin Johnson, cofundador de World Labs, «ya tenemos la capacidad de crear mundos virtuales interactivos, pero cuesta cientos de millones de dólares y mucho tiempo de desarrollo». También podrían revolucionar la robótica al darles a los robots una conciencia real de su entorno y de su propio cuerpo. Como reanudar Mashrabov, «con un modelo mundial avanzado, una IA podría desarrollar una comprensión personal de cualquier escenario en el que se encuentre y comenzar a razonar posibles soluciones».
Aunque LeCun estima Que todavía estamos al menos a una década de los modelos de mundo que imagina, la gran expectativa de la industria por ver evoluciones en el campo de la IA y la monstruosa inversión que está recibiendo este fenómeno, indican que esta tecnología podría ser el próximo gran salto hacia máquinas que no sólo reaccionen al mundo, sino que lo comprendan y modelen.
Imagen de portada | Michael Marais
En | «La seguridad de nuestros hijos no está en venta»: ya está aquí la primera ley que regula los ‘amigos de la IA’