Entreprise

L’IA de Google peut maintenant naviguer sur le Web pour vous, cliquer sur des boutons et remplir des formulaires grâce à Gemini 2.5.

Publié

on

Google a récemment lancé une version améliorée de son modèle de langage Gemini 2.5 Pro, baptisée « Utilisation de l’ordinateur Gemini 2.

5 Pro ».

Ce modèle innovant permet à des agents IA de naviguer sur le web, de remplir des formulaires et d’effectuer diverses actions d’utilisateur.

Le PDG de Google, Sundar Pichai, a souligné que cette fonctionnalité représente un avancement majeur dans le développement d’agents autonomes.

Actuellement, ce modèle n’est pas accessible directement aux consommateurs mais via un partenariat avec Browserbase, qui propose des navigateurs virtuels pour l’intégration d’agents.

Les premiers tests ont montré que Gemini 2.

5 Computer Use réussissait à accomplir certaines tâches de navigation avec efficacité, tout en souffrant de limitations, comme l’accès aux fichiers locaux, contrairement à des concurrents tels que ChatGPT et Claude.

Google a mis en avant ses performances supérieures en matière de contrôle d’interface grâce à des résultats de précision élevés et une latence réduite.

Cependant, la sécurité est une priorité, avec des protocoles stricts pour évaluer chaque action entreprise par le modèle.

Les développeurs peuvent s’attendre à des coûts similaires de tarification par jetons pour Gemini 2.5 Pro et Gemini 2.5 Computer Use, bien que certaines fonctionnalités et options d’accès diffèrent entre les deux modèles.

Leave a Reply

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Populaires

Quitter la version mobile