Auto-scaling schaalt te laat of flapt heen-en-weer

Question

Accepted Answer

1. Stel scale-out aggressief in, scale-in conservatief. Bijvoorbeeld scale-out bij 60 procent CPU 2 minuten, scale-in bij 30 procent gedurende 15 minuten. Anders krijg je flapping.
2. Kies een metriek die je echte bottleneck reflecteert. Voor web vaak request-count-per-target via ALB-target-tracking, niet CPU.
3. Stel cooldown of warm-pool in. Als instance-startup 3 minuten duurt, is een 1-minuut-evaluatie zinloos.
4. Voor predictive workloads (e-commerce, kantooruur-spike): predictive scaling op basis van patroon. Vult voor de spike aan.
5. Test je scaling onder load met een tool als k6 of Locust. Een config die nooit getest is, gaat tijdens de eerste piek omvallen.

Wanneer ons inschakelen: 
Krijg je tijdens piek toch SLA-overschrijdingen ondanks scaling, dan is een korte performance-review zinvol. De fix zit vaak in pool-warmup of in de app, niet in de auto-scaling-config.

Auto-scaling schaalt te laat of flapt heen-en-weer

Probeer dit eerst zelf

Wanneer ons inschakelen

Zie ook

Past het bovenstaande niet?

Wie ben je?

Of doe het helemaal niet zelf