Tecnología

Creíamos que ChatGPT era solo un chatbot muy capaz. Operai acaba de convertirlo en algo muy diferente: un agente real – En un click

Creíamos que ChatGPT era solo un chatbot muy capaz. Operai acaba de convertirlo en algo muy diferente: un agente real

 – En un click

Hemos estado hablando de agentes de inteligencia artificial durante mucho tiempo, pero OpenAi acaba de convertir esa conversación en algo mucho más tangible. La empresa ha presentado Chatgpt Agent, una función que convierte a su popular asistente en algo más autónomo: ahora es capaz de ejecutar tareas complejas utilizando una computadora virtual, con herramientas que le permiten navegar, programar o incluso tomar decisiones.

Del operador de agente. A principios de año, presentó al operador, una herramienta que permitió a ChatGPT interactuar con las páginas web. Luego llegó una investigación profunda, centrada en escribir informes largos de múltiples fuentes. La idea de fondo era clara: ir más allá de la conversación y abordar tareas reales. Lo que se ha presentado hoy es algo así como una herramienta que unifica todos estos avances anteriores.

Durante la manifestación, los responsables del proyecto plantearon una situación diaria: organizar un viaje para asistir a una boda. El agente pudo comprender el contexto, encontrar hoteles, proponer regalos, tener en cuenta el clima, el código de ropa e incluso recordar que tenía que comprar un traje. Lo hizo analizando el mensaje, accediendo a la web y actuando paso a paso, como lo haría una persona. La diferencia es que todo sucedió dentro de ChatGPT, sin la necesidad de alternar pestañas o dar instrucciones uno a uno.

Una computadora virtual para AI. La clave es que el agente no se limita a responder al texto: opera dentro de un tipo de computadora virtual que OpenAI ha dado acceso. Puede usar un navegador de texto para leer páginas rápidamente, un navegador visual para interactuar con botones y formularios, e incluso un terminal para ejecutar comandos, generar código y manipular archivos. También puede trabajar con hojas de cálculo, presentaciones y servicios de acceso como Google Drive, Calendar o GitHub si el usuario lo autoriza.

¿Qué hay debajo del capó? El modelo que impulsa el agente de chatgpt (desarrollado específicamente para esta función, aunque sin nombre oficial) fue entrenado con tareas complejas que requerían combinar múltiples herramientas. OpenAI usó el aprendizaje de refuerzo, el mismo enfoque que ya usa en sus modelos de razonamiento, para enseñarle a elegir cuándo usar el navegador, el terminal o una API. La idea era desarrollar una solución capaz de decidir con precisión cómo actuar en función de cada objetivo.

Cómo activar y quién puede usarlo. El modo de agente ahora está disponible para los usuarios del Pro, Plus y los planes de equipo en ChatGPT. Se activa desde el menú de herramientas o escribe directamente /agente en el cuadro de texto. Más tarde, la empresa y la educación también llegarán. En el caso del antiguo continente, Openai no ha confirmado ninguna fecha para su despliegue en el espacio económico europeo, una región donde la presión regulatoria ya ha ralentizado otro lanzamiento de la compañía.

En desarrollo.

Imágenes | Opadai

En | El objetivo es apurarse para liderar la IA que ha hecho algo inusual: está construyendo un centro de datos en tiendas de campaña

Redacción
About Author

Redacción