3.7/5 - (3 голоса)

Для современной организации, обязанной соответ­ствовать нуждам и ожиданиям своих клиентов, простои недопустимы. Возможны различные типы проис­шествий, от которых зависит доходность и даже само существование предприятия. Это может быть атака вымогателей, отключение элек­троэнергии, наводнение или просто ошибка оператора. Такие события непредсказуемы, и лучшее, что мы можем сделать, — это заранее подготовиться к ним.

Готовность подразумевает наличие добротного плана обеспечения непре­рывности бизнес-процессов и ава­рийного восстановления (BCDR). Такой план должен быть протести­рован и при необходимости без про­медлений введен в действие.

Два важных параметра, определяю­щих план BCDR, — целевая точка восстановления (RPO) и целевое время восстановления (RTO), как показано на рисунке 1.стратегия бэкапа Приведу краткое пояснение этих терминов:

  • RPO показывает, насколько дале­ко нужно вернуться во времени, и определяет максимально допу­стимое количество потерянных данных, измеряемое временем между моментом возникнове­ния неисправности и создания последней исправной резервной копии.
  • RTO характеризует время про­стоя и показывает, сколько вре­мени проходит между сбоем и вос­становлением нормального функ­ционирования системы для поль­зователей.

На первый взгляд характеристики RPO и RTO похожи, но они служат разным целям; в идеальном случае их значения стремятся к нулю. Однако в реальности стоимость достижения нулевых показателей RPO и RTO чрезвычайно высока, и затраты на это вряд ли окупятся.

Познакомимся поближе с целями вос­становления. RPO определяет, какое количество данных можно потерять, прежде чем эта потеря затронет вашу профессиональную деятельность. Например, в банковских системах про­стой в течение часа может иметь ката­строфические последствия при выпол­нении текущих транзакций. Для себя вы можете определить RPO как момент последнего сохранения документа, над которым вы работаете. В случае сбоя системы и потери данных сколько результатов работы вы готовы потерять без заметного ущерба?

С другой стороны, RTO — временные рамки, в которых приложения и система могут быть восстановлены после сбоя.

Целесообразно измерять RTO начиная с момента сбоя, а не с момента, когда специалисты ИТ-подразделения начинают устранять неполадки. Это более реалистичный подход, точно представляющий точку, когда неис­правность затронула пользователей.

Как определить значения RT0 и RP0 для ваших приложений

На самом деле универсально­го решения для плана обеспечения непрерывности бизнес- процессов и его метрик не существует. Компании, принадле­жащие к разным отраслям, различаются, имеют разные нужды и поэтому предъявляют различные требования к целям восста­новления. Однако широко прак­тикуется разделение приложений и служб по разным уровням и назначение времени восстанов­ления и целевой точки восстанов­ления в соответствии с соглаше­ниями об уровне обслуживания, действующими в компании. Классификация защиты данных важна для определения методов эффективного сохранения, доступа, защиты, восстановления и обновления информации на основе специ­фических критериев. Необходимо проанализировать ваши приложения и определить, какие из них формируют прибыль, а без каких функционирование компании невозможно. Этот процесс, без которого не удастся построить хороший план обеспечения непре­рывности бизнес-процессов, называется анализом последствий для деятельности (BIA), и он же задает протоколы и действия на случаи аварии.

Например, вы можете использо­вать трехуровневую модель для плана обеспечения непрерывности бизнес-процессов:

  • Уровень 1. Критически важные для компании приложения, для которых требуется RTO менее 15 минут.
  • Уровень 2. Критически важные для ведения бизнеса приложения, для которых требуется значение RTO 2 часа и RPO 4 часа.
  • Уровень 3. Некритические приложения, для которых требуется значение RTO 4 часа и RPO 24 часа. Следует помнить, что критически важные для существования компании и ведения бизнеса и некри­тические приложения могут быть разными в различных отраслях, и каждая компания определяет эти уровни на основании собственных критериев.

После того как вы определили приоритет своих приложений и служб и выяснили, какими будут последствия конкретных происшествий, следует найти решение, способное защитить бизнес-данные и деятель­ность компании. Veeam Availability Platform (https://www.veeam.com/availability-platform.html) — исчер­пывающий набор инструментов, спроектированный с учетом соот­ветствия строгим требованиям восстановления виртуальных, физических и «облачных» рабочих нагрузок.

Практическое применение RT0 и RP0

Быстрое восстановление элементов приложения

Агент по продажам удалил сообщение электронной почты, которое должно быть как можно быстрее отправлено клиенту. Microsoft Exchange — пример приложения уровня 2. ИТ-администратор составляет график заданий резервного копирования в течение суток, и компания может определенно достигнуть RPO со значением 1 час. С помощью программы Veeam Explorer for Microsoft Exchange, которая входит в состав всех версий Veeam Backup & Replication, очень просто восстановить отдельное сообщение электронной почты за несколько минут или даже секунд, не затрачивая время и ресурсы на промежуточ­ное сохранение или восстановление всей виртуальной машины сервера приложений (экран 1).

восстановление из бэкапа

Представим себе банк, который располагает несколькими банкома­тами. Система банкоматов (АТМ) критически важна для функци­онирования банка (уровень 2), но ее выход из строя на несколько часов повлияет на транзакции банка, а не на целостность всего предприятия. С помощью Veeam Backup & Replication и компонента Instant VM Recovery можно немедленно запустить виртуальный сервер ATM из дедуплицированного и сжатого файла резервной копии Veeam. Это обеспечит RTO со значением в несколько минут! Кроме того, благодаря функциям миграции гипер­визора и программе Veeam Quick Migration не составляет труда перенести активную виртуальную машину из хранилища данных резервных копий в рабочее хранилище данных, завершив процесс восстановле­ния (рисунок 2).восстановление виртуальной машины

Отработка отказа всего сайта

Предположим, ошибка оператора привела к сбою электропитания в одном из центров обработки дан­ных, что может привести к отка­зу всего сайта и потере доступа ко всем приложениям уровня 1. Предположим, вы используете Veeam для репликации всех крити­чески важных виртуальных машин в удаленное расположение дважды в день. Это позволяет добиться тре­буемого значения RPO в несколько минут. С точки зрения RTO про­дукт Veeam позволяет легко выполнить восстановление после серьезных аварий благодаря нескольким встроенным функциям: отработке отказа одним щелчком мыши, помощи в восстановлении размещения, правилам Re-IP для соответствия сети на сайте аварийного восста­новления (https://helpcenter.veeam.com/docs/backup/hyperv/network_ mapping.html? ver=95) и настоящему «облачному» аварийному восста­новлению (рисунок 3).

восстановление с veem

Защита конечных точек

При переходе от виртуальной инфраструктуры в реальный мир Veeam также предоставляет решения для резервного копирования и восстановления ноутбуков и настольных компьютеров. С помощью Veeam Agent for Microsoft Windows (https://www.veeam.com/windows-cloud-server-backup-agent.html) можно восстановить файлы с носителя восстановления на компьютере Windows и даже перенести резервный образ системы компьютера на виртуальную машину для снижения показателей RPO, как показано на экране 2.восстановление из бэкапа

Кроме того, с помощью Veeam Agent for Linux  можно защитить рабочие нагрузки Linux, как локальные, так и размещенные в общедоступ­ном «облаке» (экран 3).

бэкап и восстановление виртуальных машин
Никто не может предвидеть катастрофу. Однако в случае аварии вы сможете действовать организо­ванно, руководствуясь планом обеспечения непрерывности бизнес- процессов. Значения RPO и RTO могут быть различными в разных компаниях, но во все времена будет существовать компромисс между требованиями бизнеса к доступности и обязательными инвести­циями в ИТ. Их оценка должна быть результатом согласования между сотрудниками, ответственными за бизнес компании, и ИТ-специалистами. Но не подлежит сомнению необходимость найти надежное решение для виртуальных, физических и «облачных» рабочих нагрузок, обеспечив постоянную доступность вашего бизнеса.

Наша компания, обеспечит разработает и реализует план непрерывности бизнес-процессов, обращайтесь [email protected]