Корпоративное хранилище данных DWH – это масштабная система, которая проектируется в соответствии с требованиями к скорости обновления данных, глубине историчности, аналитическим сценариям и нагрузке.
Что такое DWH (Data warehouse, корпоративное хранилище данных) и как оно помогает бизнесу?
DWH хранит и обрабатывает критически важные данные по продажам, запасам, финансам, логистике, производству. Сбой работы компонентов DWH из-за технических неполадок или человеческого фактора может парализовать весь процесс принятия решений.
К сожалению, аварий в такой сложной системе невозможно избежать на 100%. Чтобы восстановление хранилища не превращалось в импровизацию и дополнительные затраты, необходимо заранее разработать план аварийного восстановления DWH (Disaster Recovery Plan, DRP).
В статье разберем, зачем при сбоях в DWH нужен полноценный план аварийного восстановления, чем он отличается от резервного копирования данных и как выглядит на практике - на примере проекта для крупного ритейлера.
1.Что такое план аварийного восстановления для DWH
2.Почему DWH нуждается в аварийном восстановлении
3.Компоненты плана аварийного восстановления для DWH
4.Как разработать DR-план для DWH
5.Разработка плана аварийного восстановления от Qlever на примере ведущего регионального ритейлера

Цель DRP – минимизировать простои и снизить финансовые и репутационные риски от потери данных, а также сделать процесс восстановления DWH управляемым и прозрачным как для ИТ-команды, так и для бизнеса.
В отличие от абстрактных рекомендаций, DRP отвечает на конкретные вопросы:
Кроме этого, план аварийного восстановления содержит схему архитектуры системы, точки хранения резервных копий, актуальные данные для доступа к управлению системой, контакты специалистов, к которым можно обратиться в случае, если внутренняя команда не справляется с последствиями сбоя.
Несмотря на важность разработки DRP, многие компании считают, что для восстановления хранилища достаточно настроить резервное копирование данных, но это не гарантирует возобновления работоспособности всей системы.
Бэкап | DR |
Архив, который фиксирует состояние данных | Стратегия восстановления компонентов, зависимостей и процессов |
Не гарантирует, что DWH и отчетность заработают в нужные сроки | Описывает предполагаемые сроки восстановления всей аналитической системы |
Скрытые зависимости и потенциальные риски потери данных обычно выявляются уже во время инцидента | Предупреждает риски и учитывает все технические особенности системы |
Без утвержденного регламента проверки бэкап может оказаться поврежденным, зараженным или пустым | Регулярно тестируется и актуализируется согласно регламенту |
Компенсирует только потери данных | Минимизируя простои и поддерживая актуальность данных, запускает бизнес заново |
При сбое в DWH бизнес теряет не просто средство обработки и хранения данных, а возможность принимать обоснованные решения на их основе.
Корпоративное хранилище данных — это основа управленческой аналитики. Когда DWH становится недоступным, BI-аналитика перестает работать, показатели не обновляются, а отчетность начинает отставать от реального положения дел.
Ключевые риски в таких условиях:
Аварии, требующие восстановления корпоративного хранилища, могут быть вызваны различными факторами:
Сбои в DWH редко ограничиваются одним событием. Чаще всего это цепочка взаимосвязанных проблем, затрагивающих разные элементы аналитического контура. Отказ может начаться с инфраструктуры, но быстро проявиться на уровне данных и отчетности.
Именно из-за этих зависимостей восстановление DWH требует системного подхода: важно запустить не только компоненты стека, но и согласованность данных, процессов и отчетности.