Mikroservislerde her şey kısmen başarısız olabilir. 8 servisten 1'i çöktü. Sonuç, tam bir kesintiden daha kötüydü.

Senaryo:

  • Kullanıcı akışı: Sırayla 8 servis
  • Servis 6 (öneriler): %50 hata oranı
  • Devre kesici yok, geri dönüş yok
  • Yeniden deneme başına 30 saniyelik zaman aşımı

Kullanıcıların yaşadığı:

  • İsteklerin %50'si: Başarılı (sonunda)
  • İsteklerin %50'si: 90+ saniye zaman aşımı
  • Kullanıcılar yeniden dener → daha fazla yük
  • Tüm servislerde iş parçacığı havuzları tükendi
  • Her şey bozulur

En kötü kısım:

  • Gösterge tabloları "Servis 6: %50 sağlıklı" gösteriyordu
  • Kullanıcıya yönelik deneyim: %0 kullanılabilir
  • Net bir sahip yok (kısmi hata kimin suçu?)

Düzeltme:

  • Tüm giden çağrılarda devre kesiciler
  • Zarif bozulma (sayfayı öneriler olmadan göster)
  • Saniye değil, ms cinsinden ölçülen zaman aşımları
  • Hataları izole etmek için bölme deseni

Ders: Dağıtık sistemlerde, önce kısmi hata için tasarım yapın.


← Alınan Derslere Dön