Категория I#
Один ЦОД. Используются скрипты и ПРК для резервного копирования виртуальных машин и конфигурационных файлов. Резервные копии могут копироваться на удаленный узел.

Пример элементов Disaster Recovery плана и процедур резервного копирования и восстановления для облачного центра обработки данных (ЦОД), построенного на базе AIC.
Виртуальные машины в ЦОД содержат различные типы приложений, такие как базы данных, серверы приложений, веб-приложения и аналитические приложения. Используются скрипты и ПО RuBackup для резервного копирования.
Категория |
I |
---|---|
RPO |
24 ч. |
RTO |
72 ч. |
DR |
без гарантий |
Доступность |
98% |
Архитектурная схема |
1 экземпляр - локально |
Standby replica данных |
Нет |
Георезервирование |
Нет |
Кластеризация |
Нет |
Отказоустойчивость инфраструктуры |
Нет |
Кластер серверов приложений |
ЦОД 1 |
Кластер СУБД |
Нет |
Порог утилизации |
80% средняя часовая |
Требование к ЦОД |
— |
Необходимые меры DR |
План |
Резервное копирование с георезервированием |
Нет |
Возможные требования при реализации#
ежедневное резервное копирование всех виртуальных машин;
ежедневное резервное копирование настроек системного ПО, такого как ОС СН Astra Linux, ПКД и ПВ из состава AIC;
автоматизация процессов резервного копирования с использованием ПРК и утилит Linux;
хранение резервных копий в безопасном внешнем хранилище;
процедуры восстановления для всех типов приложений;
документированные и протестированные планы восстановления;
мониторинг успешности выполнения резервных копий и восстановления;
восстановление виртуальных машин на альтернативных хостов в случае недоступности основных узлов;
автоматизация процессов тестирования восстановления;
отчеты о состоянии резервных копий и восстановления.
Процессы резервного копирования#
Резервное копирование виртуальных машин
Использование ПРК для автоматического создания резервных копий всех виртуальных машин ежедневно.
Хранение резервных копий на внешнем хранилище для обеспечения безопасности данных.
Резервное копирование системного ПО
Создание скриптов на bash
для резервного копирования конфигураций ОС Linux, и ПВ.
Автоматизация выполнения скриптов с помощью cron для ежедневного выполнения.
Хранение резервных копий конфигураций на внешнем хранилище.
Процессы восстановления#
Восстановление виртуальных машин
Использование ПРК для восстановления виртуальных машин из резервных копий.
Приоритетное восстановление критичных виртуальных машин (базы данных и серверы приложений).
Восстановление системного ПО
Восстановление конфигураций ПКД с помощью команды ipa-restore
.
Распаковка и восстановление конфигураций ПВ и ALSE из архивов.
Настройка резервного копирования#
Для выполнения резервного копирования и восстановления в соответствии с разработанным планом, необходимо выполнить следующие шаги:
Шаги по настройке резервного копирования:
установка и настройка ПРК:
установить ПРК на AIC (в состав AIC входит версия ПРК для резервного копирования настроек);
настроить ПРК для автоматического выполнения ежедневного резервного копирования виртуальных машин и конфигураций системного ПО;
создание и настройка скриптов резервного копирования:
создать скрипты для резервного копирования конфигураций ALSE, ПКД и ПВ;
настроить выполнение скриптов с помощью
cron
для ежедневного выполнения;
настройка внешнего хранилища:
настроить безопасное внешнее хранилище для хранения резервных копий;
убедиться, что резервные копии передаются и хранятся в шифрованном виде.
Шаги по восстановлению:
восстановление виртуальных машин:
использовать ПРК для восстановления виртуальных машин из резервных копий;
восстанавливать виртуальные машины в порядке приоритета, начиная с баз данных и серверов приложений;
восстановление конфигураций системного ПО:
восстановить конфигурации ПКД с помощью команды
ipa-restore
;распаковать и восстановить конфигурации ПВ и ALSE из архивов.
Тестирование и документирование:
тестирование резервного копирования:
провести тестирование процесса резервного копирования для всех виртуальных машин и системного ПО;
убедиться в корректности создания резервных копий и их хранения;
тестирование восстановления:
провести тестовое восстановление виртуальных машин и конфигураций системного ПО;
убедиться, что восстановление проходит успешно и данные восстанавливаются корректно;
документирование:
подготовить документацию, описывающую все процессы резервного копирования и восстановления;
включить инструкции по восстановлению в случае сбоя.
Отслеживания прогресса реализации плана#
Для отслеживания прогресса реализации плана резервного копирования и восстановления проект полезно разделить на следующие этапы:
Этап 1: Подготовка и установка:
установка ПРК на всех узлах ПВ;
настройка внешнего хранилища для резервных копий.
Этап 2: Разработка и тестирование скриптов:
создание скриптов резервного копирования для конфигураций системного ПО;
настройка
cron
для автоматического выполнения скриптов;тестирование скриптов резервного копирования.
Этап 3: Тестирование восстановления:
проведение тестового восстановления виртуальных машин;
проведение тестового восстановления конфигураций системного ПО;
документирование процессов восстановления.
Этап 4: Завершение и документация:
обучение администраторов ЦОД процессам резервного копирования и восстановления;
финальная документация всех процессов.
Оценка выполнения резервного копирования и восстановления#
Для оценки выполнения требований и производительности системы после внедрения плана резервного копирования и восстановления, необходимо провести следующие мероприятия:
Мониторинг успешности резервного копирования:
регулярно проверять журналы ПРК и
cron
на наличие ошибок;отслеживать количество успешных и неудачных резервных копий.
Тестирование восстановления на регулярной основе:
проводить тестовые восстановления данных раз в месяц;
документировать результаты тестов и устранять выявленные проблемы.
Оценка RPO и RTO:
проверять, что RPO (например, 24 часа) и RTO (например, 72 часа) достигаются в рамках тестовых восстановлений;
в случае несоответствия требованиям, проводить анализ и вносить корректировки в процессы.
Обратная связь и улучшения:
собрать обратную связь от администраторов ЦОД и пользователей;
вносить изменения в процессы на основе полученной обратной связи.