OpenAI va a la cabeza del desarrollo de inteligencia artificial gracias el lanzamiento de Operator, su primer agente de IA diseñado para realizar tareas complejas en internet de forma autónoma. Desde hacer reservas en restaurantes hasta compras basadas en imágenes, Operator llega para transformar la manera en que los usuarios interactúan con la web. Aunque la herramienta aún está en desarrollo, su potencial se ha hecho evidente en la demostración presentada por la empresa.
Una interfaz familiar con funcionalidades sorprendentes

CREATOR: gd-jpeg v1.0 (using IJG JPEG v80), quality = 82
La interfaz de Operator recuerda a ChatGPT, el chatbot estrella de OpenAI, pero con enlaces directos a servicios como Uber, OpenTable y eBay. Los usuarios pueden seleccionar estos servicios directamente desde la plataforma y delegar en Operator tareas específicas a través de comandos.
En un ejemplo compartido por OpenAI, un usuario solicitó una reserva en un restaurante. Operator procedió a acceder a la web de OpenTable, donde seleccionó el restaurante indicado y gestionó la reserva. Si bien inicialmente cometió un error al seleccionar una ubicación incorrecta, el sistema se corrigió de forma autónoma al verificar que los usuarios estaban en San Francisco. Incluso, cuando no había disponibilidad en el horario solicitado, Operator propuso alternativas, demostrando su capacidad para solucionar problemas de manera independiente.
Una herramienta que aprende a ser cada vez más precisa
Para orientarse, Operator utiliza capturas de pantalla de las páginas web, en virtud de un modelo de IA llamado Computer-Using Agent (CUA), basado en GPT‑4. Este sistema ha sido entrenado específicamente para interactuar con interfaces de usuario, reconociendo menús, campos de texto y botones. De acuerdo con OpenAI, CUA ha demostrado su eficacia en plataformas como WebArena y WebVoyager, incluso en las etapas iniciales de desarrollo.
Otra funcionalidad destacada es la capacidad de Operator para realizar compras basándose en imágenes. En la demostración, los empleados de OpenAI subieron una foto de una lista de compras, y Operator gestionó todo el proceso de adquisición de forma independiente.
Control del usuario
Aunque Operator automatiza numerosas tareas, los usuarios pueden supervisar cada paso desde la interfaz y realizar ajustes si es necesario. Sin embargo, por razones de seguridad hay ciertos límites. Operator no puede completar procesos que requieran un inicio de sesión, resolver captchas o realizar pagos sin la intervención del usuario.
Disponibilidad restringida y en desarrollo
Actualmente, Operator está disponible únicamente para usuarios Pro en Estados Unidos, quienes pagan una suscripción mensual de 200 dólares. Según OpenAI, la exclusividad se debe a que la herramienta aún está en desarrollo y requiere ajustes antes de estar disponible para otros grupos de usuarios. La visión de la compañía para el futuro incluye extender el acceso a suscripciones Plus, Team y Enterprise, e incluso integrar algunas funcionalidades de Operator directamente en ChatGPT.
Nueva perspectiva del futuro de la inteligencia artificial
Con Operator, OpenAI no solo demuestra los avances en el campo de la inteligencia artificial, sino que también plantea preguntas importantes sobre la forma en que interactuamos con la tecnología. “Operator no solo simplifica tareas, sino que redefine nuestra relación con la IA”, argumentó el equipo de OpenAI en su presentación.
Con avances tan significativo, esta herramienta pionera abre horizontes en el camino hacia un futuro donde la automatización sea una extensión natural de la vida diaria, liberando tiempo para que las personas se concentren en actividades más complejas y significativas. Mientras tanto, existe mucho interés depositado en la evolución de Operator y las posibilidades que promete abrir en la vida digital.