Kısmi Hata Cehennemi
Mikroservislerde her şey kısmen başarısız olabilir. 8 servisten 1'i çöktü. Sonuç, tam bir kesintiden daha kötüydü.
Senaryo:
- Kullanıcı akışı: Sırayla 8 servis
- Servis 6 (öneriler): %50 hata oranı
- Devre kesici yok, geri dönüş yok
- Yeniden deneme başına 30 saniyelik zaman aşımı
Kullanıcıların yaşadığı:
- İsteklerin %50'si: Başarılı (sonunda)
- İsteklerin %50'si: 90+ saniye zaman aşımı
- Kullanıcılar yeniden dener → daha fazla yük
- Tüm servislerde iş parçacığı havuzları tükendi
- Her şey bozulur
En kötü kısım:
- Gösterge tabloları "Servis 6: %50 sağlıklı" gösteriyordu
- Kullanıcıya yönelik deneyim: %0 kullanılabilir
- Net bir sahip yok (kısmi hata kimin suçu?)
Düzeltme:
- Tüm giden çağrılarda devre kesiciler
- Zarif bozulma (sayfayı öneriler olmadan göster)
- Saniye değil, ms cinsinden ölçülen zaman aşımları
- Hataları izole etmek için bölme deseni
Ders: Dağıtık sistemlerde, önce kısmi hata için tasarım yapın.