Üretim 2 saat boyunca kapalı kaldı. Kök neden: Tek bir yazım hatası.

Değişiklik:

# ConfigMap güncellemesi
                                    data:
                                    DATABASE_CONNECITON_TIMEOUT: "30000" # Yazım hatası: CONNECITON

Ne oldu:

  • Uygulama DATABASE_CONNECTION_TIMEOUT'u aradı
  • Bulamadı (yazım hatası)
  • Varsayılan değer ayarlanmamıştı
  • Zaman aşımı = null → 0 olarak yorumlandı
  • Her veritabanı sorgusu anında zaman aşımına uğradı

Neden yakalanmadı:

  • ConfigMap'ler sadece YAML'dir—şema yok
  • Kubernetes anahtar adlarını doğrulamaz
  • PR incelemesi yazım hatasını gözden kaçırdı
  • Entegrasyon testleri farklı yapılandırma kullandı

Düzeltmeler:

  • Uygulama başlangıçta gerekli ortam değişkenlerini doğrular
  • Kritik yapılandırma eksikse hızlı bir şekilde başarısız olur
  • CI'da ConfigMap'ler için şema doğrulaması
  • Sorunları erken yakalamak için kanarya dağıtımları

Ders: ConfigMap'ler kod değildir—onlara kod gibi davranın.


← Alınan Derslere Dön