Yüksek Erişilebilirlik Değildi
3 düğümde 3 replikamız vardı. Yüksek düzeyde erişilebilir olduğumuzu düşündük. Değildik.
Kurulum:
- Her hizmetin 3 kopyası
- 3 Kubernetes düğümü
- Pod anti-affinity: düğümlere yayılmış ✅
- Tüm düğümler: us-east-1a ❌
Olay:
- AWS us-east-1a kısmi kesintisi
- 3 düğümün tümü etkilendi
- Tüm podlar çıkarıldı
- Bölgede kapasite yok
- Tam hizmet kesintisi
Neden oldu:
- us-east-1a'da daha ucuz örnekler
- Otomatik sağlayıcı varsayılan olarak tek AZ'ye ayarlandı
- Kimse düğüm dağılımını kontrol etmedi
Düzeltme:
topologySpreadConstraints:
- maxSkew: 1
topologyKey: topology.kubernetes.io/zone
whenUnsatisfiable: DoNotSchedule
Ders: Bölge dağılımı olmayan replikalar yüksek erişilebilirlik değildir.