Настроихме репликация на база данни в няколко региона "за възстановяване при бедствие."

За какво плащахме:

  • Primary в us-east-1
  • Реплики за четене в eu-west-1 и ap-southeast-1
  • Трансфер на данни между региони: $8,000/месец

Какво всъщност използвахме:

  • 100% от четенията и записите от us-east-1
  • 0 failover теста за 18 месеца
  • Никакъв реален DR runbook
  • Никой не знаеше как да задейства failover

Осъзнаването:

Плащахме $8K/месец за спокойствие, което никога не валидирахме. Ако us-east-1 падне, нямахме идея дали нашият DR наистина ще работи.

Какво направихме:

  • Внедрихме тримесечни DR тестове
  • Създадохме реални runbooks
  • Намалихме до единична read реплика в us-east-1
  • Между-регионално само за студени backups в S3

Резултат: $8,000/месец → $1,200/месец, с DR който реално тестваме.

Урок: DR, който никога не е тестван, не е DR. Просто е скъп.


← Назад към Научени Уроци