OpenAI lanza GPT-5.4: el primer modelo diseñado para controlar tu ordenador mediante agentes inteligentes

La imagen actual no tiene texto alternativo. El nombre del archivo es: ee8724_openai-gpt_news.jpg

OpenAI lanza GPT-5.4: el primer modelo capaz de controlar tu PC mediante agentes inteligentes

La familia de modelos de OpenAI continúa creciendo a gran velocidad. La última incorporación, GPT-5.4, no solo mejora el rendimiento en razonamiento, programación y capacidad general de trabajo permitiendo hacer más con menos tokens, sino que incluye un novedad destacada: es el primer modelo de OpenAI diseñado para controlar el ordenador mediante agentes autónomos.

En la práctica, esto significa que GPT-5.4 va más allá de responder a un prompt o generar instrucciones. Ahora puede simular la interacción del usuario con el PC, moviendo el cursor, haciendo clic en iconos y menús, y ejecutando tareas como responder correos electrónicos, editar documentos o organizar calendarios. Todo esto se realiza de manera automatizada, como si el propio usuario estuviera manejando el ordenador.

Aunque otros modelos de propósito general ya contaban con capacidades similares de gestión de PC, la integración de estas funciones en GPT-5.4 promete un nivel de automatización y productividad mucho mayor. Para aprovechar estas funciones, es necesario utilizar OpenAI Codex o la API de OpenAI, que facilitan la conexión con aplicaciones externas como Google Drive o Photoshop, permitiendo automatizar tareas que antes requerían intervención manual.

Este lanzamiento marca un paso importante en la evolución de la IA hacia asistentes digitales que no solo sugieren acciones, sino que pueden ejecutarlas de forma autónoma y segura, optimizando el flujo de trabajo diario de usuarios y profesionales.

Fiabilidad comprobada en benchmarks

En cuanto a la precisión, OpenAI asegura que GPT-5.4 ha obtenido resultados destacados en pruebas de control de PC:

  • OSWorld-Verified: 75 % de éxito en navegación por escritorio mediante teclado y ratón, superando a los humanos (72,4 %).
  • WebArena-Verified: 67,3 % de éxito en interacciones de navegación web.
  • Online-Mind2Web: 92,8 % de aciertos.

Estas métricas reflejan que el modelo puede operar de manera consistente y fiable en entornos de trabajo digital, aunque su implementación completa todavía requiere supervisión humana para tareas críticas.

Según un redactor de PCWorld, las posibilidades de la utilización del PC en modo manos libres son enormes: bastaría con pedirle a GPT-5.4 algo como “relléname los trimestrales” para que el ordenador lanzara VeriFactu o el programa correspondiente y comenzara a trabajar en la declaración. Sin embargo, dada la novedad de la tecnología, dejar tareas tributarias completamente en manos de la IA sigue siendo arriesgado para muchos usuarios.

GPT-5.4 representa un paso significativo hacia asistentes digitales que no solo sugieren acciones, sino que las ejecutan de forma autónoma, optimizando el flujo de trabajo diario de usuarios y profesionales.

Fuente: OpenAI

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *