free AI model router

Choisis le bon modèle pour chaque tâche. win.sh score les modèles IA par qualité benchmark, force en code, raisonnement, vitesse et prix pour éviter de payer trop cher le travail facile.

Router une tâche Comparer les modèles

Are you an AI agent?

Commence ici : découverte, specs, données modèles, routes raw et fichier skill.

$ Quel modèle est le moins cher ?

$ curl https://win.sh/router/cheapest

{
  "model": "ministral-3b-2512",
  "name": "Ministral 3 3B",
  "price": "$0.100/1M tokens",
  "why": "Ministral 3 3B est le modèle utile le moins cher à $0.100/1M tokens."
}

Route by task

Choisis le meilleur modèle avant de dépenser des tokens.

Choisis la tâche, la latence, le budget et le niveau de qualité. L'AI model router envoie chaque requête vers le modèle le moins cher capable de faire le job, renvoie un fallback et explique le choix pour arrêter de brûler des tokens premium sur du travail simple.

TâcheÉcrire du code

Région du modèleToutes régions

LatenceLe plus vite possible

BudgetDépenser le moins possible

Qualité minimumHaute qualité seulement

$ curl "https://win.sh/router?task=code&latency=fast&budget=low&quality=high"

Ouvrir l'API Raw query

Recommandation

DeepSeek: DeepSeek V4 Flash

DeepSeek: DeepSeek V4 Flash has the strongest useful intelligence per blended dollar today.

Prix: $0.117
Intel: 72
Vitesse: 210/s

Bientôt

Intent Router

Bientôt, tu enverras une tâche en langage naturel et tu oublieras les réglages. win.sh classera le job, déduira la qualité, la latence, le risque et la pression budget, puis routera vers le modèle le moins cher qui devrait réussir.

Réponses instantanées

Les questions fréquentes ont déjà leurs endpoints GET.

Quel modèle a la meilleure valeur ?

https://win.sh/router/best-valueJSON https://win.sh/router/best-value/rawRAW

DeepSeek: DeepSeek V4 Flash

DeepSeek: DeepSeek V4 Flash has the strongest useful intelligence per blended dollar today.

Quel modèle utile est le moins cher ?

https://win.sh/router/cheapestJSON https://win.sh/router/cheapest/rawRAW

Ministral 3 3B

Ministral 3 3B has the lowest useful blended price at $0.1/1M tokens.

Quel modèle répond le plus vite ?

https://win.sh/router/fastestJSON https://win.sh/router/fastest/rawRAW

Ministral 3 3B

Ministral 3 3B has the highest estimated generation speed at 320 tokens/sec.

Quel modèle score le plus haut ?

https://win.sh/router/smartestJSON https://win.sh/router/smartest/rawRAW

OpenAI: GPT-5.5 Pro

OpenAI: GPT-5.5 Pro has the highest blended intelligence score in today's index.

Classement compact

Des modèles classés pour router, pas pour frimer.

Modèle	Idéal pour	Intel	Code	Reason	$/1M	Vitesse	Valeur
DeepSeek: DeepSeek V4 FlashDeepseek	RapideCheap	72	73	71	$0.117	210/s	1675.2
DeepSeek: DeepSeek V4 ProDeepseek	ReasonValeur	88	89	88	$0.566	78/s	1590.1
Google: Gemini 3.1 Flash LiteGoogle	RapideCheap	76	72	75	$0.625	168/s	518.4
Z.ai: GLM 5.2Z.ai	OpenValeur	86	84	86	$1.56	92/s	503.2
OpenAI: GPT-5.4 NanoOpenAI	RapideCheap	74	70	73	$0.515	154/s	497.1
Qwen: Qwen3.6 FlashQwen	RapideCheap	73	70	72	$0.469	190/s	479.7
MoonshotAI: Kimi K2.7 CodeMoonshotai	CodeAgent	85	92	84	$1.57	74/s	464.9
Qwen: Qwen3.7 MaxQwen	ValeurGénéral	87	86	87	$2.00	86/s	420.5
Mistral Medium 3.5Mistral	RapideGénéral	82	80	82	$1.90	104/s	303.2
Google: Gemini 3.1 Pro PreviewGoogle	Long ctxReason	92	90	92	$5.00	64/s	231.2
Anthropic: Claude Sonnet 4.6Anthropic	CodeAgent	94	95	93	$6.60	52/s	196.4
Anthropic: Claude Opus 4.8Anthropic	FrontierReason	99	96	99	$11.00	28/s	152.8
OpenAI: GPT-5.5OpenAI	FrontierGénéral	96	94	96	$12.50	44/s	115.5
OpenAI: GPT-5.5 ProOpenAI	FrontierReason	100	97	100	$75.00	24/s	23.5
Ministral 3 3BMistral	Rapidecheapest	58	52	56	$0.100	320/s	10

Méthode

Les benchmarks posent le plancher. Le router fait le tradeoff.

L'index part de scores type benchmark pour intelligence, code, raisonnement, latence, vitesse et taille de contexte. Il applique ensuite une politique par tâche pour choisir le modèle le moins cher qui passe la barre de qualité.

Base benchmark

Chaque modèle vérifié a un score d'intelligence, plus des scores séparés de code et raisonnement. Des feeds benchmark configurés peuvent étendre la table seed.

Score de valeur

Les prix sont normalisés en dollars pondérés par million de tokens, puis comparés au plancher de qualité utile.

Politique par tâche

Le code favorise le score code. La planification et l'analyse dure favorisent le raisonnement. Les résumés et extractions favorisent l'exécution fiable et cheap.

Fallback inclus

Chaque route renvoie un modèle de secours pour réessayer sans repasser par de la devinette.

Comment la recommandation est faite

Index mis à jour Jun 29, 2026.

1
Normaliser prix, vitesse, contexte et scores type benchmark dans une table comparable.
2
Calculer la valeur comme intelligence utile par dollar pondéré après filtrage des modèles trop faibles.
3
Appliquer les réglages de tâche, latence, budget et qualité de la requête.
4
Renvoyer le meilleur modèle, le fallback, la politique et une raison en langage clair.

FAQ

FAQ AI model router

Qu'est-ce qu'un AI model router ?

Un AI model router choisit le meilleur modèle pour une tâche en pesant qualité benchmark, force en code ou raisonnement, vitesse, contexte et prix des tokens.

Le AI model router win.sh est-il gratuit ?

Oui. Les endpoints GET publics pour les recommandations, model ids bruts, gagnants par catégorie, OpenAPI, llms.txt et l'index des modèles sont gratuits en lecture.

Comment un agent IA doit-il utiliser ce router ?

Utilise /llms.txt pour la découverte, /openapi.json pour le contrat, /router/models pour la table complète et /router/raw quand l'agent veut seulement un model id.

Peut-on limiter le routing à certains providers ou régions ?

Oui. Ajoute providers=anthropic,openai ou regions=us,eu,china à /router ou /router/raw. Le router choisit seulement parmi les modèles qui matchent et renvoie 400 si aucun ne correspond.

Comment les modèles sont-ils scorés ?

L'index garde des signaux séparés pour intelligence, code, raisonnement, vitesse, latence, contexte et prix pondéré. Le routing par tâche change les poids avant de renvoyer un modèle et un fallback.

Quand utiliser les endpoints raw ?

Utilise les endpoints raw dans les scripts, jobs CI ou agents qui veulent un model id en texte brut sans parser du JSON.

Puis-je l'installer comme skill agent ?

Oui. Le SKILL.md public explique quand appeler le router, quel endpoint utiliser et comment valider le modèle sélectionné.