3 düğümde 3 replikamız vardı. Yüksek düzeyde erişilebilir olduğumuzu düşündük. Değildik.

Kurulum:

  • Her hizmetin 3 kopyası
  • 3 Kubernetes düğümü
  • Pod anti-affinity: düğümlere yayılmış ✅
  • Tüm düğümler: us-east-1a ❌

Olay:

  • AWS us-east-1a kısmi kesintisi
  • 3 düğümün tümü etkilendi
  • Tüm podlar çıkarıldı
  • Bölgede kapasite yok
  • Tam hizmet kesintisi

Neden oldu:

  • us-east-1a'da daha ucuz örnekler
  • Otomatik sağlayıcı varsayılan olarak tek AZ'ye ayarlandı
  • Kimse düğüm dağılımını kontrol etmedi

Düzeltme:

topologySpreadConstraints:
                                    - maxSkew: 1
                                    topologyKey: topology.kubernetes.io/zone
                                    whenUnsatisfiable: DoNotSchedule

Ders: Bölge dağılımı olmayan replikalar yüksek erişilebilirlik değildir.


← Alınan Derslere Dön