Faire tourner Claude Code gratuitement avec free-claude-code

Claude Code est devenu l'outil de coding agentique le plus utilisé au monde. Mais entre 20 et 200 dollars par mois, avec des rate limits qui te coupent en pleine session, beaucoup de devs cherchent des alternatives. Le repo GitHub Alishahryar1/free-claude-code a explosé à plus de 22 000 étoiles parce qu'il permet d'utiliser exactement la même interface Claude Code, avec d'autres modèles moins chers ou gratuits derrière.

Pourquoi c'est utile

Tu gardes 100% de l'interface Claude Code que tu connais déjà : CLI, extension VS Code, JetBrains ACP. Même terminal, mêmes commandes, mêmes raccourcis.
Six backends au choix selon ton budget : NVIDIA NIM, Kimi, OpenRouter, DeepSeek, LM Studio, llama.cpp et Ollama.
Routage par tier : tu peux envoyer les requêtes Opus chez un provider, Sonnet chez un autre, Haiku chez un troisième.
Support du picker /model natif de Claude Code via le endpoint Gateway.
Bonus : wrappers Discord et Telegram pour piloter Claude Code à distance, transcription vocale via Whisper ou NVIDIA NIM.

Repo GitHub free-claude-code avec 22.7k stars, MIT license, et la description "Use claude-code for free in the terminal, VSCode extension or discord"

Pourquoi ça aide : 22k étoiles en quelques semaines, c'est le signal que le projet marche vraiment et que tu vas trouver de l'aide rapidement en cas de souci.

Comment ça marche

Normalement, quand tu tapes une commande dans Claude Code, la requête part vers l'API Anthropic, qui te facture les tokens. Le repo installe un petit serveur FastAPI sur ton ordi, sur le port 8082. Tu configures Claude Code pour qu'il envoie ses requêtes à ce serveur local au lieu d'Anthropic. Le serveur les transforme et les route vers le provider de ton choix.

Claude Code CLI / IDE
        |
        | API Anthropic Messages
        v
Free Claude Code proxy (:8082)
        |
        v
NIM / Kimi / OpenRouter / DeepSeek / LM Studio / llama.cpp / Ollama

Claude Code croit toujours qu'il parle à Anthropic. Tu changes zéro ligne de Claude Code, juste deux ou trois variables d'environnement.

Étape par étape

Étape 1 — Installer les prérequis

Tu as besoin de Claude Code, puis du gestionnaire uv avec Python 3.14.

npm install -g @anthropic-ai/claude-code

Sur macOS ou Linux :

curl -LsSf https://astral.sh/uv/install.sh | sh
uv self update
uv python install 3.14

Sur Windows, équivalent en PowerShell :

powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"
uv self update
uv python install 3.14

Section Quick Start du repo avec les commandes d'install npm et curl pour macOS/Linux

Pourquoi ça aide : uv est le gestionnaire Python ultra rapide qu'il faut pour faire tourner le proxy. Python 3.14 est obligatoire, sinon l'install plante.

Étape 2 — Cloner le repo et configurer le .env

git clone https://github.com/Alishahryar1/free-claude-code.git
cd free-claude-code
cp .env.example .env

Édite .env et choisis un provider. Pour partir sur NVIDIA NIM qui est gratuit :

NVIDIA_NIM_API_KEY="nvapi-ta-cle-ici"
MODEL="nvidia_nim/z-ai/glm4.7"
ANTHROPIC_AUTH_TOKEN="freecc"

Le ANTHROPIC_AUTH_TOKEN est un secret local que Claude Code renvoie au proxy. Mets ce que tu veux, juste pas vide en prod.

Pourquoi ça aide : tu peux changer de provider à tout moment sans réinstaller. Tout passe par ce fichier .env.

Étape 3 — Choisir ton provider et récupérer une clé

Le format des modèles est toujours provider_id/model/name. Voici les trois options principales :

Option A : NVIDIA NIM (gratuit). Va sur build.nvidia.com/settings/api-keys, génère une clé nvapi-.... Quelques modèles dispos : nvidia_nim/z-ai/glm4.7, nvidia_nim/z-ai/glm5, nvidia_nim/moonshotai/kimi-k2.5, nvidia_nim/minimaxai/minimax-m2.5.

Modale "API Key Granted" sur NVIDIA NIM avec une clé nvapi-... à copier immédiatement

Pourquoi ça aide : NVIDIA NIM te donne accès à GLM, Kimi et Minimax gratuitement, sans carte bancaire. C'est l'option zéro friction pour tester.

Option B : OpenRouter (ultra cheap ou gratuit). Va sur openrouter.ai/keys, crée une clé sk-or-.... T'as une section "free models" avec des modèles à 0 dollar par million de tokens. Exemple : open_router/stepfun/step-3.5-flash:free ou open_router/deepseek/deepseek-r1-0528:free.

Catalogue OpenRouter filtré sur "Free" : DeepSeek R1T2 Chimera, KAT-Coder-Pro, Devstral 2, tous à $0/M tokens

Option C : Ollama, LM Studio ou llama.cpp (local sur ton GPU). Installe Ollama depuis ollama.com :

ollama pull llama3.1
ollama serve

Puis dans le .env :

OLLAMA_BASE_URL="http://localhost:11434"
MODEL="ollama/llama3.1"

Étape 4 — Lancer le proxy et brancher Claude Code

Dans un premier terminal, lance le proxy :

uv run uvicorn server:app --host 0.0.0.0 --port 8082

Dans un second terminal, lance Claude Code en pointant vers le proxy :

ANTHROPIC_AUTH_TOKEN="freecc" \
ANTHROPIC_BASE_URL="http://localhost:8082" \
CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY=1 \
claude

Sur PowerShell :

$env:ANTHROPIC_AUTH_TOKEN="freecc"
$env:ANTHROPIC_BASE_URL="http://localhost:8082"
$env:CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY="1"
claude

Tape /model dans Claude Code pour voir la liste des modèles dispos via ton proxy. Tape ensuite n'importe quel prompt, ça part chez ton provider et pas chez Anthropic.

Pourquoi ça aide : ces trois variables sont la seule chose qui change pour Claude Code. Tout le reste de tes workflows continue de fonctionner à l'identique.

Le pattern qui change tout : mixer les providers par tier

Le vrai move, une fois que ça tourne, c'est de mapper chaque tier Claude vers un provider différent. Tu mets un modèle smart en orchestrateur, et tu fais router les sous-tâches lourdes vers du DeepSeek ou du GLM 4.7 gratuit.

MODEL_OPUS="nvidia_nim/moonshotai/kimi-k2.5"
MODEL_SONNET="open_router/deepseek/deepseek-r1-0528:free"
MODEL_HAIKU="lmstudio/unsloth/GLM-4.7-Flash-GGUF"
MODEL="nvidia_nim/z-ai/glm4.7"

Tu paies les vrais tarifs uniquement sur les décisions stratégiques. Le reste tourne pour quelques centimes ou zéro dollar.

Brancher l'extension VS Code

Dans les settings VS Code, cherche claude-code.environmentVariables et ajoute :

"claudeCode.environmentVariables": [
  { "name": "ANTHROPIC_BASE_URL", "value": "http://localhost:8082" },
  { "name": "ANTHROPIC_AUTH_TOKEN", "value": "freecc" },
  { "name": "CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY", "value": "1" }
]

Recharge l'extension. Si elle te demande de te connecter à Anthropic Console, valide une fois, le proxy gère le reste.

Pour aller plus loin

Repo officiel : https://github.com/Alishahryar1/free-claude-code
NVIDIA NIM (clé gratuite) : https://build.nvidia.com/settings/api-keys
OpenRouter (modèles cheap et gratuits) : https://openrouter.ai/keys
DeepSeek (endpoint Anthropic-compatible) : https://platform.deepseek.com/api_keys
Ollama (local) : https://ollama.com

Une dernière chose. Le repo expose aussi un wrapper Discord et Telegram pour lancer des sessions Claude Code à distance depuis ton téléphone, avec messages vocaux transcrits via Whisper local ou NVIDIA NIM. Si tu codes en mobilité, c'est un game changer.