Sla over naar inhoud

Auto-scaling schaalt te laat of flapt heen-en-weer

Drie kalibraties: warming-time, scale-out moet sneller dan scale-in, en kies de juiste metriek. Default-CPU-target werkt zelden voor moderne apps.

Probeer dit eerst zelf

  1. 1Stel scale-out aggressief in, scale-in conservatief. Bijvoorbeeld scale-out bij 60 procent CPU 2 minuten, scale-in bij 30 procent gedurende 15 minuten. Anders krijg je flapping.
  2. 2Kies een metriek die je echte bottleneck reflecteert. Voor web vaak request-count-per-target via ALB-target-tracking, niet CPU.
  3. 3Stel cooldown of warm-pool in. Als instance-startup 3 minuten duurt, is een 1-minuut-evaluatie zinloos.
  4. 4Voor predictive workloads (e-commerce, kantooruur-spike): predictive scaling op basis van patroon. Vult voor de spike aan.
  5. 5Test je scaling onder load met een tool als k6 of Locust. Een config die nooit getest is, gaat tijdens de eerste piek omvallen.

Wanneer ons inschakelen

Krijg je tijdens piek toch SLA-overschrijdingen ondanks scaling, dan is een korte performance-review zinvol. De fix zit vaak in pool-warmup of in de app, niet in de auto-scaling-config.

Zie ook

Past het bovenstaande niet?

Beschrijf je situatie hieronder. We sturen jouw input plus de stappen die je al zag naar onze AI en geven gericht vervolg-advies. Als het te risicovol is om zelf te doen, zeggen we dat ook.

Wie ben je?

Voor de AI-vraag hebben we je e-mailadres en bedrijfsnaam nodig, zo kunnen we opvolgen als de AI er niet uitkomt, en voorkomt het misbruik van de tool.

Maximaal 2 vragen per uur en 5 per dag, bewust beperkt zodat de AI snel en goed blijft. Voor meer help je jezelf en ons door direct contact op te nemen.

Of doe het helemaal niet zelf

Onze Managed IT-klanten zoeken dit soort vragen niet op. Eén aanspreekpunt, vaste prijs per maand, en het is binnen werktijd opgelost.