Сегодня многие применяют катастрофоустойчивые системы во взаимодействии с технологиями консолидации и виртуализации, репликации и надёжной защиты информации. Заказчик может создать самостоятельно катастрофоустойчивый ЦОД или обратить за помощью к специалистам, которые предоставляют эту услугу.nnКаждая компания для успешного ведения бизнеса использует ИТ технологии, иногда даже создаёт отдельный центр, который отвечает за обработку информации и сокращённо называется ЦОД. Надёжность центра является главным критерием при его выборе, поэтому специалисты постоянно работают над повышением надёжности дата-центра. Они обеспечивают не только аппаратуру, но также усовершенствуют катастрофоустойчивость.nnСогласно последним исследованиям, которые проводила ЕМС, стало известно, что около 82 процентов организаций не уверены в полном восстановлении информации. Каждый год компании во всём мире несут потери примерно в 1,7 млрд. долларов из-за потери данных. На территории России ситуация выглядит не лучшим образом, так как только 2 процента компаний уверены в том, что их ИТ-инфраструктура будет надёжно работать при любых обстоятельствах. Около половины опрошенных организаций могут потерпеть потери вследствие аварии или стихийного бедствия. Причины аварии могут быть различными: неисправности в оборудовании, перебои в работе системы электропитания, ураганы или наводнения.nnПредотвратить аварии невозможно, но стоит подготовиться и создать такие условия, чтобы их последствия не сказывались негативным образом на ведении бизнеса. Именно отказоустойчивая инфраструктура позволяет повысить сохранность данных. Она создаётся на территориально удаленной площадке и предоставляет резервные мощности для стабильной работы всей системы.nnДавайте рассмотрим основные термины:n
- Катастрофоустойчивость – это возможность восстановления системы после катастрофы (природных катаклизмов или террористических актов).
- Отказоустойчивость системы – это свойство, которое позволяет восстановить работоспособность всей системы после сбоя в функционировании любого компонента.
- Если система выполняет поставленную задачу в нужный момент времени, тогда можно говорить о её высокой доступности.
- Непрерывность бизнеса заключается в том, что с помощью необходимого оборудования, процессов и методов бизнес нормально функционирует даже в самых критичных ситуациях.
- Recovery Time Objective или RTO – это время, которое необходимо потратить на восстановление системы.
- Recovery Point Objective или RPO – количество информации, которую можно потерять даже после аварийного восстановления.
- Recovery Capacity Objective или RCO – этот показатель определяет нагрузку, с которой должна справится резервная система.
Особенности катастрофоустойчивых центров обработки данных
Для эффективного ведения бизнеса и для надёжной защиты данных от возможных потерь в результате различных техногенных или природных катастроф, а также терактов стоит подумать о резервной копии. Никто не застрахован от несчастья, поэтому даже здание центра обработки информации может быть уничтоженным. Следует задействовать удалённую территориально площадку для хранения и выбрать достойный дата-центр.nnОбычно ЦОД располагается на нескольких площадках, поэтому стоит особое внимание уделить организации резервируемых каналов связи, спланировать произведение резервного копирования для дальнейшего восстановления, осуществить репликацию информации между хранилищами. Синхронизация данных позволит сохранить актуальность информации даже при отказе работы одного из узлов.nnРаспределение ЦОД может производиться в двух вариантах:n
- «активный – активный» – вся инфраструктура распределяется между площадками, пользователь работает с той, которая находится ближе всех;
- «активный – пассивный» – приложения и сервера являются централизованными, поэтому каждый пользователь должен работать только с основным узлом. Если происходит сбой, тогда резервный цод начинает активно функционировать.
Довольно часто для создания надёжной ЦОД используется общая сеть хранения информации, к которой подключается вся кластерная конфигурация серверов. Эти узлы размещают на главной площадке, а также на резервной для подстраховки и создания единой системы. Поэтому сервисы будут доступными даже при потере основной площадки. Кластеризация позволяет создать автоматическое переключение с основного на резервный ЦОД, в результате выхода из строя первого.nnС помощью протоколов MPLS или IP можно устанавливать связь между площадками, дистанция которых для синхронной репликации не должна превышать 100 км. При использовании синхронной репликации приложение должно получить подтверждение на обеих сторонах.nnДля обеспечения непрерывности бизнеса необходимо использовать катастрофоустойчивое решение, с помощью которого система хранения данных или СХД распределяется территориально. Сегодня они уже обладают встроенными решениями. Так, СХД могут быть идентичными, а связь между ними создаётся при помощи резервированных высокоскоростных каналов. Такой подход позволяет создавать проекты при высокой надёжности передачи информации, применяя синхронную или асинхронную репликацию файлов.nnНекоторые СХД дают возможность увеличивать расстояние между площадками, используя средства дискового массива. Таким образом, можно создать доступное катастрофоустойчивое решение, и при этом не трогать архитектуру системы. Ещё одним вариантом можно назвать применение облачной инфраструктуры Microsoft Azure, которая поможет произвести резервное хранение различных файлов.nnК примеру, резервный ЦОД размещён за пределами города и расстояние составляет около 400 км, тогда IP или MPLS/VPLS, DWDM помогут наладить LAN связь, а FCIP и DWDM отлично подойдут для SAN связи. Для этого примера отличным решением станет асинхронная репликация, ведь для синхронной понадобится задействовать дополнительные инструменты, чтобы преодолеть такое расстояние. Если площадки находятся на огромном расстоянии, которое измеряется в километрах, тогда создаётся геокластер. Кластеризацию можно производить различными способами, которые предоставляют производители приложений, операционных систем и сетевого оборудования.n
Экономика катастрофоустойчивости
Нужно помнить, что для воплощения стратегий DR необходимо вкладывать денежные средства. Достаточно сложно прийти к решению о создании такой системы, при этом понимая, что резервное восстановления вам может вообще не пригодиться. Но необходимо понимать, что в случае чрезвычайной ситуации, вы сможете оперативно и без дополнительных затрат восстановить систему и в результате у вас не будет простоя. Мировой опыт ведения бизнеса доказывает, что при потере дата-центра всего на 10 дней компания в течение года разоряется. Поэтому стоит быть готовым ко всему.nnВ первую очередь следует соблюдать баланс между затратами на услугу катастрофоустойчивости и потерями в бизнесе за период восстановления после аварии. Главное правило заключается в том, что для быстрого восстановления системы необходимы дорогие методы. Чем меньше этот период, тем выше уровень затрат.nnЧтобы обеспечить катастрофоустойчивость ИТ, следует сделать большую работу, так как необходимо создать две площадки, наладить быстрый канал связи между ними, обеспечить работу сети для передачи данных, создать систему хранения, которая будет производить репликацию информации, а также приобрести необходимое оборудование для создания надёжного электроснабжения и охлаждения центра обработки данных. Для его отличной работы понадобится найти группу специалистов, которая будет заниматься поддержкой и настройкой системы, а также использовать новые методы и производить их тестирование.n
Новые надёжные способы защиты от катастроф при помощи виртуализации и облачных технологий
- Репликация в облако – этот процесс происходит между площадками, а также может включать все машины, необходимые базы данных или их снимки. Благодаря облачным технологиям каждый клиент может выбрать тот вариант, который удовлетворит его пожелания в плане времени простоя и финансовых возможностей.
- Виртуализация в виде резервного копирования – необходимо понимать, что для восстановления виртуальной машины потребует гораздо меньше усилий, чем для физического сервера. Резервная площадка полностью повторяет главную. Поэтому при любой сбое в работе основной площадки, резервная полностью её замещает и сохраняет все файлы.
- Применение технологий программного конфигурирования во многом напоминает виртуализацию. Различные платформы создают гибкую среду, которая отвечает за отказоустойчивость системы благодаря виртуальным устройствам, которые выполняют те же функции, что машины на веб-серверах. Пользователи даже не заметят, что произошёл сбой, так как они автоматически будут перемещены на резервную площадку.
- IaaS – это инфраструктура по требованию, которая позволяет быстро произвести восстановление данных, используя ИТ-ресурсы. При помощи облачных технологий и виртуализации можно создавать различные экономичные решения в любом распределении ЦОД. Главным критерием выступает гибкость, ведь именно время переключения на резервную площадку поможет привести потери к минимуму.
Если компания не может позволить создать свой ЦОД, тогда можно воспользоваться аутсорсингом, который является доступным в наше время. Согласно недавнему опросу, аварийное восстановление является очень распространённым среди других видов аутсорсинга, его отметили 92 процента опрошенных компаний.
Услуга резервного центра обработки данных
Если компания не может позволить себе создать собственную ЦОД, тогда можно обратиться за помощью к профессионалам. Провайдер предлагает виртуальный центр, который поможет защитить всю информацию от потери при любой катастрофе или аварии. Этот вариант является самым оптимальным для обеспечения катастрофоустойчивости всей системы и его принято называть DRaaS, что означает резервный ЦОД как услуга. Такой вариант решения проблемы снимает с клиента много забот, так как он полностью доверяется специалистам, которые отвечают за организационные и материально-технические стороны этого вопроса.nnПровайдер всегда использует два или больше дата-центров, которые находятся в разных географических точках. Они располагаются в соответствующих зданиях для гарантирования высокой защищённости. Если выбрать виртуальный ЦОД, тогда можно быть уверенным, что будет использоваться основная и резервная площадка. Если в основном экземпляре произойдут любого рода изменения, то они будут отражаться и в резервном. Каждый экземпляр является замкнутым, поэтому будет и дальше функционировать независимо от работоспособности других площадок. При аварии на главной площадке, все пользователи автоматически переходят на резервный экземпляр. При опросе российских респондентов, многие отметили важность наличия у провайдера нескольких ЦОД, которые находятся на разных территориях, ведь именно они обеспечивают катастрофоустойчивость.nnМногие компании предлагают целый комплекс услуг, которые гарантируют создание резервного экземпляра при работе с основным ЦОД. Некоторые провайдеры для размещения основной площадки используют несколько, чтобы повысить уровень защиты при любой сбом или аварии. Также в предлагаемые услуги может входить размещение оборудования и виртуальных вычислительных ресурсов, создание волоконно-оптических линий для скоростной связи, произведение синхронизации между различными площадками, резервное копирование и высокая защита от любого рода взломов.n
Мы предлагаем подобрать и реализовать именно для вашей задачи наиболее подходящий вариант обеспечения отказоустойчивости с минимальным временем восстановления и доступным по цене методом, подробнее [email protected]