Le contexte
Une plateforme SaaS B2B française, 50 personnes dont 12 ingénieurs, en levée de fonds Series A imminente. La facture AWS pèse 18 000 €/mois et a doublé en 18 mois sans qu’on sache pourquoi. Le CFO commence à poser des questions, le board exige une trajectoire de coûts maîtrisée pour la prochaine levée.
Côté technique, l’équipe est compétente mais sous l’eau : roadmap produit chargée, pas de FinOps engineer, personne pour prendre le sujet sérieusement. Trois personnes lisent occasionnellement Cost Explorer, sans plan d’action.
Le diagnostic en 2 semaines
L’audit a révélé un schéma classique de PME en croissance :
| Poste | Avant audit | Pourquoi |
|---|---|---|
| Compute (EC2 + RDS) | 8 200 €/mois | 0 % en Reserved Instances ou Savings Plans |
| NAT Gateway | 1 800 €/mois | Aucun VPC Endpoint, tout le trafic S3 passait par NAT |
| Data transfer cross-AZ | 1 100 €/mois | App + RDS éclatés sur 3 AZ sans nécessité |
| CloudWatch Logs | 700 €/mois | Aucune retention configurée, ingestion DEBUG en prod |
| Snapshots EBS | 450 €/mois | 80 % orphelins (volumes supprimés depuis > 6 mois) |
| Dev/staging | 2 200 €/mois | Tournait 24/7 |
| Le reste | 3 550 €/mois | EC2 over-provisioned, ALB vides, EIP non attachées |
Un constat simple : 30 à 40 % de la facture pouvait disparaître sans toucher au comportement applicatif, juste en activant les leviers FinOps standards. Ils n’avaient simplement jamais eu le temps.
L’intervention
Le plan d’action priorisé sur 3 mois :
Mois 1 — Engagement + tagging
Première étape, nettoyer les fondations. Sans tagging cohérent, impossible d’aller plus loin. Tags Environment, Owner, Project, CostCenter propagés via Terraform sur 100 % des ressources existantes en 5 jours, validés dans Cost Explorer après 48 h.
En parallèle, engagement Compute Savings Plans sur 70 % du baseline EC2 + Lambda + Fargate, calibré sur 6 mois d’historique. Économie immédiate : −3 100 €/mois. ROI : 0 jour, c’est un changement de tarification.
Mois 2 — Quick wins infrastructure
- VPC Gateway Endpoints S3 + DynamoDB déployés sur tous les VPCs : trafic NAT divisé par 2,5
- CloudWatch Logs retention configurée à 30 j (prod) / 7 j (staging) / 1 j (dev) sur 200+ log groups
- EventBridge + Lambda pour stop/start automatique des instances dev hors heures ouvrées (lun-ven 8h-20h)
- Right-sizing 12 instances sur recommandation Compute Optimizer, en staging puis prod, fenêtre par fenêtre
- Lifecycle policies S3 sur 3 buckets de logs > 1 To : transition Standard → IA → Glacier IR
- Nettoyage des orphelins : 240 snapshots EBS, 18 EIP, 4 ALB vides, 14 volumes EBS détachés
Mois 3 — Discipline continue
Mise en place du drill mensuel automatisé :
- Lambda hebdomadaire qui scanne et alerte sur les nouveaux orphelins (snapshots, EIP, volumes)
- Dashboard Cost Explorer partagé en daily standup
- Budget AWS avec alertes Slack à 80 % et 100 %
- Office hours bimensuelles pour arbitrer les nouvelles décisions d’architecture
Les résultats mesurés
À la fin du retainer (mois 3) :
| Indicateur | Avant | Après | Delta |
|---|---|---|---|
| Facture AWS mensuelle | 18 000 € | 10 400 € | −42 % |
| Couverture Compute SP | 0 % | 72 % | — |
| Trafic NAT mensuel | 4,2 To | 1,6 To | −62 % |
| Logs CloudWatch ingérés | 280 GB | 95 GB | −66 % |
| Coût dev/staging | 2 200 €/mois | 720 €/mois | −67 % |
| Ressources orphelines | 280 | 0 | −100 % |
Aucun incident pendant les 3 mois d’intervention. Aucune ligne de code applicatif modifiée.
Ce qu’on en retient
Trois leçons que nous appliquons systématiquement maintenant :
- Le tagging est le levier zéro. Sans lui, on optimise à l’aveugle. C’est toujours la première semaine.
- Les Savings Plans sont la quick win la plus rentable, mais nécessitent un baseline stable et de la confiance dans la trajectoire produit. Ne pas les engager si le produit pivote dans les 6 mois.
- La discipline continue compte plus que l’audit one-shot. Sans la routine mensuelle, les économies se réérodent en 6 mois. C’est pour ça que le retainer existe — pas pour que vous restiez dépendants, mais pour que la discipline s’installe avant qu’on s’efface.
Le client a basculé sur un suivi trimestriel léger après les 3 mois initiaux. La facture AWS reste sous 11 000 €/mois aujourd’hui malgré une croissance de 30 % du trafic.
"On savait qu'on payait trop, mais on n'avait ni le temps ni l'expertise pour creuser. En 2 semaines on avait la cartographie complète et la roadmap. 3 mois plus tard, la facture avait baissé de 42 % sans qu'on ait touché à une ligne de code applicatif."
Votre situation est différente ?
Discutons-en 15 minutes.
Chaque mission est cadrée individuellement après un appel sans engagement.
Réserver un créneau