Tecnología

OpenAI presenta Operator, una IA capaz de usar la web por ti

OpenAI ha lanzado un nuevo agente de inteligencia artificial (IA) diseñado para realizar diversas tareas en línea en nombre de los usuarios. El producto se conoce como Operator y «usando su propio navegador, puede mirar una página web e interactuar con ella escribiendo, haciendo clic y desplazándose», según la startup.

Operator es uno de los primeros asistentes de IA de la firma enfocado en la ejecución independiente de múltiples tareas. Está diseñado para automatizar actividades repetitivas en cualquier navegador. Es capaz de completar formularios, realizar pedidos de comestibles, gestionar reservaciones de servicios o programar reuniones virtuales con una sola indicación.

El recurso está disponible en una “versión preliminar de investigación, lo que implica limitaciones en su funcionalidad y capacidad de procesamiento. La organización dirigida por Sam Altman promete que su producto evolucionará “en función de los comentarios» recibidos.


El modelo OpenAI o1 puede actuar en contra de las indicaciones explícitas de los usuarios, lo que sugiere que el sistema podría perseguir objetivos propios.


“Operator transforma a la IA de una herramienta pasiva a un recurso activo en el ecosistema digital. Su capacidad de utilizar las mismas interfaces con las que los humanos interactúan a diario amplía la utilidad de la IA, lo que ayuda a las personas a ahorrar tiempo en las tareas cotidianas”, de acuerdo con OpenAI.

El asistente busca posicionarse como un aliado del sector público y privado. La compañía está colaborando con corporaciones como DoorDash, Instacart, OpenTable, Priceline, StubHub, Thumbtack y Uber para satisfacer las necesidades de los clientes finales, “respetando las normas establecidas”. Agrega que está explorando “a fondo” casos de uso» con autoridades de la ciudad de Stockton, California, para agilizar los procesos administrativos.

¿Cómo funciona la nueva IA de OpenAI?

El funcionamiento de Operator está basado en el modelo de IA Computer-Using Agent (CUA) que combina las capacidades de visión y razonamiento de GPT-4o mediante una técnica de aprendizaje por refuerzo. Esto significa que CUA está capacitado para interactuar con los botones, menús y campos de texto que las personas ven en una pantalla, sin necesidad de integrar API’s personalizadas.

Los desarrolladores señalan que el asistente usa “sus capacidades de razonamiento para autocorregirse”. Cuando no puede cumplir con una tarea, devuelve el control al usuario para garantizar una experiencia fluida y colaborativa. El sistema está diseñado para proteger información confidencial y evita compartir credenciales o datos sensibles con los sitios web. OpenAI subraya que Operator “rechaza solicitudes dañinas y bloquear contenido no permitido”.

X content

This content can also be viewed on the site it originates from.

Disponibilidad y uso

Los interesados en usar Operator solo deben ingresar al portal ‘operator.chatgpt.com’ y describir la tarea que desean realizar. En cualquier momento, pueden tomar el control del navegador remoto. Recibirán alertas proactivas cuando se requieran acciones específicas que involucran información sensible, como calves de acceso y datos para procesar pagos. El programa permite configurar instrucciones específicas para sitios web concretos.

La nueva IA solo está disponible para los suscriptores del plan ChatGPT Pro en Estados Unidos. OpenAI planea ampliar su alcance a usuarios en otros países y ofrecerlo en sus membresías Plus, Team y Enterprise en el futuro.



DERECHOS DE AUTOR
Esta información pertenece a su autor original y fue recopilada del sitio https://es.wired.com/articulos/openai-presenta-operator-una-ia-capaz-de-hacer-tareas-por-ti-en-la-web

Publicaciones relacionadas

Botón volver arriba