free AI model router

Choisis le bon modèle pour chaque tâche. win.sh score les modèles IA par qualité benchmark, force en code, raisonnement, vitesse et prix pour éviter de payer trop cher le travail facile.

Router une tâche Comparer les modèles

Are you an AI agent?

Commence ici : découverte, specs, données modèles, routes raw et fichier skill.

Route by task

Choisis le meilleur modèle avant de dépenser des tokens.

Choisis la tâche, la latence, le budget et le niveau de qualité. L'AI model router envoie chaque requête vers le modèle le moins cher capable de faire le job, renvoie un fallback et explique le choix pour arrêter de brûler des tokens premium sur du travail simple.
TâcheÉcrire du code
Région du modèleToutes régions
LatenceLe plus vite possible
BudgetDépenser le moins possible
Qualité minimumHaute qualité seulement

Meilleur modèle pour écrire du code ?

Recommandation
DeepseekDeepSeek: DeepSeek V4 Flash

DeepSeek: DeepSeek V4 Flash has the strongest useful intelligence per blended dollar today.

Prix
$0.117
Intel
72
Vitesse
210/s

Bientôt

Intent Router

Bientôt, tu enverras une tâche en langage naturel et tu oublieras les réglages. win.sh classera le job, déduira la qualité, la latence, le risque et la pression budget, puis routera vers le modèle le moins cher qui devrait réussir.

Réponses instantanées

Les questions fréquentes ont déjà leurs endpoints GET.

Classement compact

Des modèles classés pour router, pas pour frimer.

ModèleIdéal pourIntelCodeReason$/1MVitesseValeur
Deepseek
DeepSeek: DeepSeek V4 FlashDeepseek
RapideCheap
727371$0.117210/s1675.2
Deepseek
DeepSeek: DeepSeek V4 ProDeepseek
ReasonValeur
888988$0.56678/s1590.1
Google
Google: Gemini 3.1 Flash LiteGoogle
RapideCheap
767275$0.625168/s518.4
Z.ai
Z.ai: GLM 5.2Z.ai
OpenValeur
868486$1.5692/s503.2
OpenAI
OpenAI: GPT-5.4 NanoOpenAI
RapideCheap
747073$0.515154/s497.1
Qwen
Qwen: Qwen3.6 FlashQwen
RapideCheap
737072$0.469190/s479.7
Moonshotai
MoonshotAI: Kimi K2.7 CodeMoonshotai
CodeAgent
859284$1.5774/s464.9
Qwen
Qwen: Qwen3.7 MaxQwen
ValeurGénéral
878687$2.0086/s420.5
Mistral
Mistral Medium 3.5Mistral
RapideGénéral
828082$1.90104/s303.2
Google
Google: Gemini 3.1 Pro PreviewGoogle
Long ctxReason
929092$5.0064/s231.2
Anthropic
Anthropic: Claude Sonnet 4.6Anthropic
CodeAgent
949593$6.6052/s196.4
Anthropic
Anthropic: Claude Opus 4.8Anthropic
FrontierReason
999699$11.0028/s152.8
OpenAI
OpenAI: GPT-5.5OpenAI
FrontierGénéral
969496$12.5044/s115.5
OpenAI
OpenAI: GPT-5.5 ProOpenAI
FrontierReason
10097100$75.0024/s23.5
Mistral
Ministral 3 3BMistral
Rapidecheapest
585256$0.100320/s10

Méthode

Les benchmarks posent le plancher. Le router fait le tradeoff.

L'index part de scores type benchmark pour intelligence, code, raisonnement, latence, vitesse et taille de contexte. Il applique ensuite une politique par tâche pour choisir le modèle le moins cher qui passe la barre de qualité.

Base benchmark

Chaque modèle vérifié a un score d'intelligence, plus des scores séparés de code et raisonnement. Des feeds benchmark configurés peuvent étendre la table seed.

Score de valeur

Les prix sont normalisés en dollars pondérés par million de tokens, puis comparés au plancher de qualité utile.

Politique par tâche

Le code favorise le score code. La planification et l'analyse dure favorisent le raisonnement. Les résumés et extractions favorisent l'exécution fiable et cheap.

Fallback inclus

Chaque route renvoie un modèle de secours pour réessayer sans repasser par de la devinette.

Comment la recommandation est faite

Index mis à jour Jun 29, 2026.

  1. 1

    Normaliser prix, vitesse, contexte et scores type benchmark dans une table comparable.

  2. 2

    Calculer la valeur comme intelligence utile par dollar pondéré après filtrage des modèles trop faibles.

  3. 3

    Appliquer les réglages de tâche, latence, budget et qualité de la requête.

  4. 4

    Renvoyer le meilleur modèle, le fallback, la politique et une raison en langage clair.

FAQ

FAQ AI model router

Qu'est-ce qu'un AI model router ?

Un AI model router choisit le meilleur modèle pour une tâche en pesant qualité benchmark, force en code ou raisonnement, vitesse, contexte et prix des tokens.

Le AI model router win.sh est-il gratuit ?

Oui. Les endpoints GET publics pour les recommandations, model ids bruts, gagnants par catégorie, OpenAPI, llms.txt et l'index des modèles sont gratuits en lecture.

Comment un agent IA doit-il utiliser ce router ?

Utilise /llms.txt pour la découverte, /openapi.json pour le contrat, /router/models pour la table complète et /router/raw quand l'agent veut seulement un model id.

Peut-on limiter le routing à certains providers ou régions ?

Oui. Ajoute providers=anthropic,openai ou regions=us,eu,china à /router ou /router/raw. Le router choisit seulement parmi les modèles qui matchent et renvoie 400 si aucun ne correspond.

Comment les modèles sont-ils scorés ?

L'index garde des signaux séparés pour intelligence, code, raisonnement, vitesse, latence, contexte et prix pondéré. Le routing par tâche change les poids avant de renvoyer un modèle et un fallback.

Quand utiliser les endpoints raw ?

Utilise les endpoints raw dans les scripts, jobs CI ou agents qui veulent un model id en texte brut sans parser du JSON.

Puis-je l'installer comme skill agent ?

Oui. Le SKILL.md public explique quand appeler le router, quel endpoint utiliser et comment valider le modèle sélectionné.