Make et tokens IA : les coûts cachés à connaître
Un scénario Make + GPT mal calibré peut coûter 300€/mois au lieu de 30€. Méthode d'audit et optimisations qui fonctionnent.
Make ne facture pas les tokens IA, mais OpenAI, Anthropic et Mistral oui. Et un scénario Make mal conçu peut transformer une facture de 30€/mois en 300€/mois sans changer de fonctionnalité. Voici comment auditer et optimiser.
Les trois gros postes de gaspillage
1. Le prompt système répété à chaque exécution. Si votre scénario tourne 10 000 fois par mois avec un prompt système de 500 tokens, c'est 5M tokens/mois — soit 25€ rien que pour rappeler le contexte à chaque fois. Solution : prompts plus courts, ou cache de contexte (Anthropic propose le prompt caching à -90% sur la partie cachée).
2. Les contextes overlong. Envoyer 3 emails complets à GPT pour qu'il en extraie 3 lignes de résumé : c'est 6000 tokens d'input pour 200 tokens de sortie. Tronquez en amont (Make a un module Text Parser).
3. Les boucles non bornées. Un Iterator qui appelle GPT pour chaque ligne d'un tableur de 5000 lignes : c'est 5000 appels API. Souvent on peut batcher (envoyer 20 lignes par appel) et diviser le coût par 15.
Méthode d'audit en 4 étapes
- Exporter les logs OpenAI sur 30 jours (dashboard OpenAI > Usage > Export CSV).
- Identifier le top 3 des scénarios qui consomment 80% des tokens.
- Mesurer le ratio input/output. Au-delà de 10:1, il y a presque toujours un problème.
- Tester les alternatives. GPT-4o-mini est 30x moins cher que GPT-4 et suffit pour 80% des cas (classification, résumé, extraction).
Optimisations qui marchent
- Switch GPT-4 → GPT-4o-mini sur les tâches simples : -97% de coût.
- Prompt caching Anthropic sur les workflows à contexte stable : -90% sur le bloc caché.
- Batch processing : grouper 10-50 items par appel = -80 à -90% du coût.
- Filtrage en amont : ne pas envoyer à GPT ce qu'un filtre Make peut résoudre (regex, contains, etc.).
- Limites strictes :
max_tokensexplicite sur chaque appel, pour éviter les sorties verbeuses.
Règle de cadrage avant de lancer un scénario IA
Estimez le coût mensuel avant le go-live : (nombre d'exécutions/mois × tokens input × prix input) + (nombre d'exécutions × tokens output × prix output). Si vous obtenez plus de 50€/mois pour un cas pas business-critical, optimisez avant de déployer.
Cet article est publié par le cabinet d'experts Foxpilot, spécialisé dans la conception et le déploiement d'automatisations IA et no-code en entreprise depuis Paris.
Outils mentionnés