browser-use : l'agent navigateur gratuit qui remplace ChatGPT Agent
Un dev a sorti en open-source ce qu'OpenAI et Anthropic vendent à 200$ par mois. 83,5K étoiles GitHub, MIT, marche avec ChatGPT, Claude, Gemini ou n'importe quel LLM.

Pendant que tout le monde regardait ChatGPT Agent et Claude piloter un navigateur dans des démos officielles, deux développeurs ont sorti la même chose en gratuit sur GitHub. Et c'est en train d'exploser.
Le projet s'appelle browser-use. Quatre-vingt-trois mille étoiles GitHub, neuf mille sept cents forks, licence MIT, gratuit. Tu installes ça en une commande, tu branches le LLM que tu veux derrière (ChatGPT, Claude, Gemini, ou même un modèle local), et tu lui parles en français normal. Lui ouvre un vrai navigateur Chrome, clique sur les boutons, remplit les formulaires, scrolle, extrait les données, et te ramène le résultat.
C'est exactement le concept que vendent OpenAI avec Operator et Anthropic avec computer use. Sauf que ces deux-là sont fermés, payants, et verrouillés sur un seul modèle. Browser-use est ouvert, gratuit, et tu choisis ton cerveau.
Pourquoi c'est utile
- Tu automatises des tâches qui te prennent des heures par semaine (candidatures, prospection, scraping, courses en ligne) sans écrire de code
- Tu paies zéro abonnement récurrent, contrairement aux agents fermés à deux cents dollars par mois
- Tu peux le faire tourner sur ta propre machine, sans envoyer tes données à un tiers
- Tu choisis ton LLM en fonction du contexte (modèle rapide pour les tâches simples, modèle puissant pour les flows complexes, modèle local pour les données sensibles)
- Tu peux modifier le code, l'intégrer dans tes propres outils, ou le déployer en production sans demander la permission à personne
Trois choses qu'il fait à ta place

Les cas d'usage que la communauté pousse le plus sont ceux qui demandent beaucoup de répétition et peu de jugement.
Le premier, c'est la candidature en masse. Tu lui balances ton CV et la liste d'annonces qui t'intéressent. Il ouvre chaque page, lit la fiche de poste, remplit chaque champ du formulaire avec tes infos, upload ton CV au bon endroit, et clique sur "envoyer". Ce qui prenait une journée entière prend une heure.
Le deuxième, c'est les courses Instacart et e-commerce. Tu lui dis "commande la liste de courses de la semaine, vise le moins cher quand c'est possible". Il ouvre le site, cherche chaque produit, compare les prix, ajoute au panier, et te valide la commande. C'est aussi utilisable sur Amazon, Cdiscount, ou n'importe quel site marchand.
Le troisième, c'est la prospection LinkedIn et email. Tu lui donnes une liste de cinquante leads avec ton message type. Il ouvre chaque profil, lit la bio, personnalise le message en fonction du contexte, envoie l'invitation, et te note les réponses dans un Google Sheet. Cinquante DM personnalisés en une heure, là où à la main tu en faisais dix avec un copier-coller flemmard.
Comment ça marche

La promesse de browser-use, c'est qu'il n'y a pas de courbe d'apprentissage. Tu installes la lib avec une commande, tu lui donnes une clé API (la tienne, pas celle d'un fournisseur tiers), et tu lui parles.
L'étape un, c'est l'installation. Une seule ligne dans ton terminal et la lib est dispo. Pas de configuration complexe, pas de Docker à monter, pas de fichier YAML à remplir.
L'étape deux, c'est de brancher ton LLM. Tu colles ta clé API ChatGPT ou Claude dans une variable d'environnement, et browser-use sait où aller chercher l'intelligence. Tu peux changer de modèle à tout moment, juste en changeant la clé.
L'étape trois, c'est de lui dire ce que tu veux. En français normal, comme si tu parlais à un assistant. "Cherche-moi les dix meilleurs hôtels à Lisbonne pour ce weekend, classés par rapport qualité-prix, et fais-moi un tableau Excel". Pas de prompt technique, pas de syntaxe spéciale.
L'étape quatre, c'est lui qui bosse. Une fenêtre Chrome s'ouvre sur ton écran (ou en arrière-plan si tu préfères), et il fait défiler les pages, clique, remplit, extrait. Tu peux regarder en direct comme un film, ou faire autre chose pendant ce temps.
Pourquoi pas juste ChatGPT Agent ou Operator

C'est la question qu'on te posera. La réponse tient en cinq points.
Sur le prix, ChatGPT Agent et Operator sont à environ deux cents dollars par mois. Browser-use est gratuit à vie, et tu paies juste les tokens du LLM que tu branches derrière (donc une fraction du tarif, surtout si tu choisis un modèle économique).
Sur le code source, les deux agents d'OpenAI sont des boîtes noires. Tu cliques, tu pries que ça marche. Browser-use est open-source, tu peux lire chaque ligne et comprendre exactement ce qui se passe quand il agit pour toi.
Sur le choix du modèle, les agents payants te forcent à utiliser GPT ou Claude selon le vendeur. Browser-use accepte n'importe quoi, ce qui te permet de combiner un modèle rapide pour la navigation et un modèle puissant pour le raisonnement.
Sur le self-host, les agents payants tournent sur les serveurs du vendeur, qui voit tout ce que tu fais. Browser-use tourne chez toi, sur ta machine ou ton VPS, et personne ne sait quelles pages tu visites.
Sur la personnalisation, les agents payants sont figés. Browser-use, tu modifies le code si tu veux ajouter un comportement spécifique ou l'intégrer à tes propres outils.
Tu choisis ton LLM

Le truc qui rend browser-use plus malin que les agents payants, c'est qu'il accepte quasiment tout ce qui existe comme LLM. ChatGPT, Claude, Gemini, DeepSeek, Llama via Ollama (donc en local sur ta machine), Mistral, Grok. Tu colles la clé API du modèle de ton choix dans la variable d'environnement correspondante, et c'est branché.
Le bonus c'est que l'équipe browser-use a sorti son propre modèle, ChatBrowserUse, optimisé spécifiquement pour la navigation web. Il est trois à cinq fois plus rapide que les modèles généralistes sur les tâches de browsing, parce qu'il a été entraîné uniquement sur ce genre de scénarios. Tu paies 0,20$ par million de tokens d'entrée et 2$ par million de sortie, ce qui te revient à quelques centimes par session.
Pour qui c'est
Si tu es freelance et que tu passes du temps sur des tâches répétitives en navigateur (prospection, candidature, saisie de données), c'est la chose la plus rentable que tu peux installer cette semaine. Tu récupères des heures par jour.
Si tu fais du growth ou du marketing, c'est ton nouvel outil de scraping et d'enrichissement de leads. Tu n'as plus besoin d'un service tiers à cinquante dollars par mois pour aller chercher des données accessibles publiquement sur LinkedIn ou ailleurs.
Si tu es dev et que tu veux intégrer un agent navigateur dans ton produit, tu as enfin une brique open-source solide. Tu construis dessus, tu modifies, tu déploies.
Bottom line
Browser-use est probablement le projet open-source le plus important de 2026 dans le domaine des agents IA. Quatre-vingt-trois mille étoiles GitHub en quelques mois, deux mille quatre cents projets qui dépendent déjà de la lib, et une équipe qui pousse une release toutes les deux semaines. Le repo est ici : github.com/browser-use/browser-use, et tu peux tester l'interface cloud gratuite sur leur site avant même d'installer la lib en local.
Si tu utilises ChatGPT ou Claude tous les jours et que tu n'as pas encore branché un agent navigateur derrière, c'est le moment.
Accède aux ressources gratuites
Vidéos, guides, templates et outils pour automatiser ton quotidien avec l'IA. Laisse ton email — accès immédiat, à vie.
✓ Pas de spam · ✓ Accès gratuit à vie · ✓ Désinscription en 1 clic
On utilise ton email pour t'envoyer la ressource et nos guides IA. Tu peux te désinscrire à tout moment. Voir notre politique de confidentialité.