Au début de l’année, le PDG d’Openai, Sam Altman, a mentionné dans son article de blog que 2025 sera l’année des agents de l’IA. Fondamentalement, les agents sont des outils d’IA qui non seulement répondent avec du texte ou génèrent des images, mais effectuent des tâches pour vous.
Aujourd’hui, Openai dévoilé Son premier agent AI appelé Operator, un outil qui peut exécuter des tâches et prendre des mesures pour vous sur un navigateur Web. Par exemple, vous pouvez demander à l’opérateur quelque chose comme «Vérifiez la recette de poulet au beurre et ajoutez tous les ingrédients nécessaires à mon panier. J’ai déjà des bâtons de yaourt et de cannelle. L’opérateur vérifiera la recette et ajoutera tous les ingrédients de votre panier à l’exception de ceux que vous avez déjà. Un outil utile pour effectuer des tâches quotidiennes, banales et répétitives.
De même, vous pouvez réserver des billets de vol, remplir des formulaires, vérifier le relevé bancaire du mois dernier, acheter en ligne ou même annuler un achat et demander un remboursement – l’opérateur d’Openai peut tout faire. Assez fascinant, non? Décomposons tout pour voir ce qu’est l’opérateur, comment cela fonctionne et comment vous pouvez commencer.
Qu’est-ce que l’opérateur d’Openai?
L’opérateur est le premier agent d’IA d’OpenAI qui combine des capacités de vision et de raisonnement pour effectuer des tâches en votre nom sur votre ordinateur. Cette technologie est alimentée par Openai Agent à usage informatique (CUA) modèle. Attendez, quoi? Essentiellement, CUA prend des captures d’écran pour «voir» ce qui est à l’écran, puis interagit avec le navigateur en cliquant, en tapant et en faisant défiler – en imitant généralement ce que vous feriez avec une souris et un clavier. Il fonctionne de manière similaire à l’utilisation de l’ordinateur de Claude et au projet Mariner de Google.
Maintenant, voici le Catch: Operator est actuellement dans sa phase de prévisualisation de recherche, donc il ne peut fonctionner que dans un environnement de navigateur virtuel pour l’instant. Le contrôle complet du niveau OS est un objectif à long terme – pas encore disponible.
Même à ce stade précoce, l’opérateur montre des résultats impressionnants. Dans des repères basés sur un navigateur comme Webarena (un environnement Web simulé) et Webvoyager (Tests sur des sites Web en direct comme Amazon et Google Maps), l’opérateur a atteint les taux de réussite de 58,1% et 87%respectivement. Pour le contexte, humains avoir un taux de réussite de 78,2% en webarena. Pas trop minable, hein?
Non seulement cela, Openai affirme que l’opérateur est capable d’apprendre de ses erreurs et même de les auto-corriger. Impressionnant si vrai.
Comment utiliser l’opérateur maintenant
Si vous êtes ravi d’essayer l’opérateur, voici l’accord: actuellement, c’est dans une phase d’aperçu de recherche et uniquement disponible pour Utilisateurs professionnels aux États-Unis OpenAI prévoit d’étendre l’accès aux utilisateurs de plus, d’équipe et d’entreprise à l’avenir et finalement de le déployer à un public plus large, l’intégrant directement dans le chatgpt. Cependant, si vous êtes en Europe, vous devrez attendre un peu plus longtemps.
Le début de l’opérateur est simple:
- Se connecter à operator.chatgpt.com en utilisant votre compte pro.
- Donnez une invite à expliquer ce que vous voulez que l’opérateur fasse. Par exemple: «Trouvez les meilleures offres sur les vols vers Miami et réservez un dans mon budget» ou «recherchez des offres d’emploi en marketing et enregistrez les détails dans un document».
- L’opérateur reprend le navigateur virtuel, effectue la tâche et vous permet de savoir quand c’est fait. Il demande votre contribution lors de la gestion des tâches sensibles comme la saisie de mots de passe ou les détails de paiement.
Vous pouvez prendre le contrôle à tout moment que vous souhaitez utiliser Mode de prise de contrôle. Donc, si vous pensez que quelque chose est éteint ou mal et que vous devez être corrigé, vous pouvez arrêter l’opérateur au milieu. Besoin de faire quelque chose quotidiennement? Créez l’invite parfaite et ensuite Enregistrer cette invite sur la page d’accueil pour utiliser quotidiennement.
Pour l’instant, l’opérateur est un aperçu de ce qui est possible lorsque l’IA évolue des outils passifs aux assistants numériques actifs alimentés par l’IA. Que vous automatisant des tâches répétitives ou que vous exploriez ses limites, l’opérateur offre un aperçu fascinant de l’avenir de l’IA. Donc, si vous êtes un utilisateur professionnel aux États-Unis, pourquoi ne pas le donner une chance?
Mais en même temps, il augmente également plusieurs comme ce qui se passe si quelqu’un pirate et l’opérateur remplace les instructions humaines, certains bogues qui conduisent à des actions et des conséquences imprévus, des données (toutes ces captures d’écran), et bien sûr, de la confidentialité et de la sécurité. OpenAI a énuméré plusieurs mesures de sécurité comme mode de surveillance, surveillanceetc. Pour les contrer, mais il y a toujours un risque. Cependant, à long terme, la commodité gagne sur les risques potentiels si la hausse est importante. L’opérateur peut vous faire économiser beaucoup de temps que vous pouvez diriger vers quelque chose de plus productif ou créatif.