Faire tourner Claude Code gratuitement avec free-claude-code
Le proxy GitHub à 22k étoiles qui te laisse utiliser Claude Code avec NVIDIA NIM, DeepSeek, Kimi ou Ollama pour zéro à 5% du coût Anthropic.

Claude Code est devenu l'outil de coding agentique le plus utilisé au monde. Mais entre 20 et 200 dollars par mois, avec des rate limits qui te coupent en pleine session, beaucoup de devs cherchent des alternatives. Le repo GitHub Alishahryar1/free-claude-code a explosé à plus de 22 000 étoiles parce qu'il permet d'utiliser exactement la même interface Claude Code, avec d'autres modèles moins chers ou gratuits derrière.
Pourquoi c'est utile
- Tu gardes 100% de l'interface Claude Code que tu connais déjà : CLI, extension VS Code, JetBrains ACP. Même terminal, mêmes commandes, mêmes raccourcis.
- Six backends au choix selon ton budget : NVIDIA NIM, Kimi, OpenRouter, DeepSeek, LM Studio, llama.cpp et Ollama.
- Routage par tier : tu peux envoyer les requêtes Opus chez un provider, Sonnet chez un autre, Haiku chez un troisième.
- Support du picker
/modelnatif de Claude Code via le endpoint Gateway. - Bonus : wrappers Discord et Telegram pour piloter Claude Code à distance, transcription vocale via Whisper ou NVIDIA NIM.

Pourquoi ça aide : 22k étoiles en quelques semaines, c'est le signal que le projet marche vraiment et que tu vas trouver de l'aide rapidement en cas de souci.
Comment ça marche
Normalement, quand tu tapes une commande dans Claude Code, la requête part vers l'API Anthropic, qui te facture les tokens. Le repo installe un petit serveur FastAPI sur ton ordi, sur le port 8082. Tu configures Claude Code pour qu'il envoie ses requêtes à ce serveur local au lieu d'Anthropic. Le serveur les transforme et les route vers le provider de ton choix.
Claude Code CLI / IDE
|
| API Anthropic Messages
v
Free Claude Code proxy (:8082)
|
v
NIM / Kimi / OpenRouter / DeepSeek / LM Studio / llama.cpp / Ollama
Claude Code croit toujours qu'il parle à Anthropic. Tu changes zéro ligne de Claude Code, juste deux ou trois variables d'environnement.
Étape par étape
Étape 1 — Installer les prérequis
Tu as besoin de Claude Code, puis du gestionnaire uv avec Python 3.14.
npm install -g @anthropic-ai/claude-code
Sur macOS ou Linux :
curl -LsSf https://astral.sh/uv/install.sh | sh
uv self update
uv python install 3.14
Sur Windows, équivalent en PowerShell :
powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"
uv self update
uv python install 3.14

Pourquoi ça aide : uv est le gestionnaire Python ultra rapide qu'il faut pour faire tourner le proxy. Python 3.14 est obligatoire, sinon l'install plante.
Étape 2 — Cloner le repo et configurer le .env
git clone https://github.com/Alishahryar1/free-claude-code.git
cd free-claude-code
cp .env.example .env
Édite .env et choisis un provider. Pour partir sur NVIDIA NIM qui est gratuit :
NVIDIA_NIM_API_KEY="nvapi-ta-cle-ici"
MODEL="nvidia_nim/z-ai/glm4.7"
ANTHROPIC_AUTH_TOKEN="freecc"
Le ANTHROPIC_AUTH_TOKEN est un secret local que Claude Code renvoie au proxy. Mets ce que tu veux, juste pas vide en prod.
Pourquoi ça aide : tu peux changer de provider à tout moment sans réinstaller. Tout passe par ce fichier .env.
Étape 3 — Choisir ton provider et récupérer une clé
Le format des modèles est toujours provider_id/model/name. Voici les trois options principales :
Option A : NVIDIA NIM (gratuit). Va sur build.nvidia.com/settings/api-keys, génère une clé nvapi-.... Quelques modèles dispos : nvidia_nim/z-ai/glm4.7, nvidia_nim/z-ai/glm5, nvidia_nim/moonshotai/kimi-k2.5, nvidia_nim/minimaxai/minimax-m2.5.

Pourquoi ça aide : NVIDIA NIM te donne accès à GLM, Kimi et Minimax gratuitement, sans carte bancaire. C'est l'option zéro friction pour tester.
Option B : OpenRouter (ultra cheap ou gratuit). Va sur openrouter.ai/keys, crée une clé sk-or-.... T'as une section "free models" avec des modèles à 0 dollar par million de tokens. Exemple : open_router/stepfun/step-3.5-flash:free ou open_router/deepseek/deepseek-r1-0528:free.

Option C : Ollama, LM Studio ou llama.cpp (local sur ton GPU). Installe Ollama depuis ollama.com :
ollama pull llama3.1
ollama serve
Puis dans le .env :
OLLAMA_BASE_URL="http://localhost:11434"
MODEL="ollama/llama3.1"
Étape 4 — Lancer le proxy et brancher Claude Code
Dans un premier terminal, lance le proxy :
uv run uvicorn server:app --host 0.0.0.0 --port 8082
Dans un second terminal, lance Claude Code en pointant vers le proxy :
ANTHROPIC_AUTH_TOKEN="freecc" \
ANTHROPIC_BASE_URL="http://localhost:8082" \
CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 \
claude
Sur PowerShell :
$env:ANTHROPIC_AUTH_TOKEN="freecc"
$env:ANTHROPIC_BASE_URL="http://localhost:8082"
$env:CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY="1"
claude
Tape /model dans Claude Code pour voir la liste des modèles dispos via ton proxy. Tape ensuite n'importe quel prompt, ça part chez ton provider et pas chez Anthropic.
Pourquoi ça aide : ces trois variables sont la seule chose qui change pour Claude Code. Tout le reste de tes workflows continue de fonctionner à l'identique.
Le pattern qui change tout : mixer les providers par tier
Le vrai move, une fois que ça tourne, c'est de mapper chaque tier Claude vers un provider différent. Tu mets un modèle smart en orchestrateur, et tu fais router les sous-tâches lourdes vers du DeepSeek ou du GLM 4.7 gratuit.
MODEL_OPUS="nvidia_nim/moonshotai/kimi-k2.5"
MODEL_SONNET="open_router/deepseek/deepseek-r1-0528:free"
MODEL_HAIKU="lmstudio/unsloth/GLM-4.7-Flash-GGUF"
MODEL="nvidia_nim/z-ai/glm4.7"
Tu paies les vrais tarifs uniquement sur les décisions stratégiques. Le reste tourne pour quelques centimes ou zéro dollar.
Brancher l'extension VS Code
Dans les settings VS Code, cherche claude-code.environmentVariables et ajoute :
"claudeCode.environmentVariables": [
{ "name": "ANTHROPIC_BASE_URL", "value": "http://localhost:8082" },
{ "name": "ANTHROPIC_AUTH_TOKEN", "value": "freecc" },
{ "name": "CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY", "value": "1" }
]
Recharge l'extension. Si elle te demande de te connecter à Anthropic Console, valide une fois, le proxy gère le reste.
Pour aller plus loin
- Repo officiel :
https://github.com/Alishahryar1/free-claude-code - NVIDIA NIM (clé gratuite) :
https://build.nvidia.com/settings/api-keys - OpenRouter (modèles cheap et gratuits) :
https://openrouter.ai/keys - DeepSeek (endpoint Anthropic-compatible) :
https://platform.deepseek.com/api_keys - Ollama (local) :
https://ollama.com
Une dernière chose. Le repo expose aussi un wrapper Discord et Telegram pour lancer des sessions Claude Code à distance depuis ton téléphone, avec messages vocaux transcrits via Whisper local ou NVIDIA NIM. Si tu codes en mobilité, c'est un game changer.
Accède aux ressources gratuites
Vidéos, guides, templates et outils pour automatiser ton quotidien avec l'IA. Laisse ton email — accès immédiat, à vie.
✓ Pas de spam · ✓ Accès gratuit à vie · ✓ Désinscription en 1 clic