Quel modèle IA pour quel cas dans Make ?

GPT-4o-mini pour classification, extraction simple, résumé court. Claude 3.5 Sonnet pour le raisonnement complexe et le long contexte. GPT-4o pour la qualité maximale quand le coût n'est pas un sujet.

Le prompt caching est-il dispo dans Make ?

Oui via le module HTTP custom (Anthropic API directe). Le module Make natif Anthropic ne l'expose pas encore. Le caching réduit le coût des tokens d'entrée cachés de 90%.

Peut-on plafonner les dépenses OpenAI ?

Oui, dans le dashboard OpenAI > Settings > Limits. Définissez un soft limit (alerte) et un hard limit (coupure). Indispensable en production.

Tous les articles

Optimisation 10/06/2026 5 min

Make et tokens IA : les coûts cachés à connaître

Un scénario Make + GPT mal calibré peut coûter 300€/mois au lieu de 30€. Méthode d'audit et optimisations qui fonctionnent.

Make ne facture pas les tokens IA, mais OpenAI, Anthropic et Mistral oui. Et un scénario Make mal conçu peut transformer une facture de 30€/mois en 300€/mois sans changer de fonctionnalité. Voici comment auditer et optimiser.

Les trois gros postes de gaspillage

1. Le prompt système répété à chaque exécution. Si votre scénario tourne 10 000 fois par mois avec un prompt système de 500 tokens, c'est 5M tokens/mois — soit 25€ rien que pour rappeler le contexte à chaque fois. Solution : prompts plus courts, ou cache de contexte (Anthropic propose le prompt caching à -90% sur la partie cachée).

2. Les contextes overlong. Envoyer 3 emails complets à GPT pour qu'il en extraie 3 lignes de résumé : c'est 6000 tokens d'input pour 200 tokens de sortie. Tronquez en amont (Make a un module Text Parser).

3. Les boucles non bornées. Un Iterator qui appelle GPT pour chaque ligne d'un tableur de 5000 lignes : c'est 5000 appels API. Souvent on peut batcher (envoyer 20 lignes par appel) et diviser le coût par 15.

Méthode d'audit en 4 étapes

Exporter les logs OpenAI sur 30 jours (dashboard OpenAI > Usage > Export CSV).
Identifier le top 3 des scénarios qui consomment 80% des tokens.
Mesurer le ratio input/output. Au-delà de 10:1, il y a presque toujours un problème.
Tester les alternatives. GPT-4o-mini est 30x moins cher que GPT-4 et suffit pour 80% des cas (classification, résumé, extraction).

Optimisations qui marchent

Switch GPT-4 → GPT-4o-mini sur les tâches simples : -97% de coût.
Prompt caching Anthropic sur les workflows à contexte stable : -90% sur le bloc caché.
Batch processing : grouper 10-50 items par appel = -80 à -90% du coût.
Filtrage en amont : ne pas envoyer à GPT ce qu'un filtre Make peut résoudre (regex, contains, etc.).
Limites strictes : max_tokens explicite sur chaque appel, pour éviter les sorties verbeuses.

Règle de cadrage avant de lancer un scénario IA

Estimez le coût mensuel avant le go-live : (nombre d'exécutions/mois × tokens input × prix input) + (nombre d'exécutions × tokens output × prix output). Si vous obtenez plus de 50€/mois pour un cas pas business-critical, optimisez avant de déployer.

Cet article est publié par le cabinet d'experts Foxpilot, spécialisé dans la conception et le déploiement d'automatisations IA et no-code en entreprise depuis Paris.

Outils mentionnés

Make ChatGPT

Make et tokens IA : les coûts cachés à connaître

Les trois gros postes de gaspillage

Méthode d'audit en 4 étapes

Optimisations qui marchent

Règle de cadrage avant de lancer un scénario IA

À lire aussi

Agents IA en 2026 : où en est vraiment le marché ?

n8n vs Make en 2026 : le verdict après 100 projets

GEO & AEO : comment se faire citer par ChatGPT et Perplexity

Questions fréquentes

Make et tokens IA : les coûts cachés à connaître