Мулти-регион репликация, която никой не ползва
Настроихме репликация на база данни в няколко региона "за възстановяване при бедствие."
За какво плащахме:
- Primary в us-east-1
- Реплики за четене в eu-west-1 и ap-southeast-1
- Трансфер на данни между региони: $8,000/месец
Какво всъщност използвахме:
- 100% от четенията и записите от us-east-1
- 0 failover теста за 18 месеца
- Никакъв реален DR runbook
- Никой не знаеше как да задейства failover
Осъзнаването:
Плащахме $8K/месец за спокойствие, което никога не валидирахме. Ако us-east-1 падне, нямахме идея дали нашият DR наистина ще работи.
Какво направихме:
- Внедрихме тримесечни DR тестове
- Създадохме реални runbooks
- Намалихме до единична read реплика в us-east-1
- Между-регионално само за студени backups в S3
Резултат: $8,000/месец → $1,200/месец, с DR който реално тестваме.
Урок: DR, който никога не е тестван, не е DR. Просто е скъп.