Роль Облака все растет, а в новых реалиях пандемии и закрытия целых стран на карантин становится критически важной для многих бизнесов. Поэтому сегодня компании готовы (а иногда и вынуждены) пройти extra mile, чтобы быстро воплотить те изменения, на которые долго не решались. Ведь это дает возможность не только выстоять в турбулентные времена, но и получить дополнительные конкурентные преимущества.

Я поделюсь своим видением того, почему это происходит, какие именно потребности появляются у компаний и какие новые возможности кризис открывает сервисным компаниям в сфере Клауд и DevOps.

Изменения вызвала пандемия

Сервисным компаниям важно понимать, что происходит у клиентов, какие их актуальные потребности чем мы можем улучшить их бизнес, чтобы выжать максимум из сложившейся ситуации.

Сейчас клиентов можно разделить на три условные категории:

  • Неожиданно стремительно растут — количество клиентов увеличилось в сотни раз за считанные дни. ИТ-инфраструктуры компаний к этому не были готовы, соответственно не могут выдержать такой нагрузки. Сюда прежде всего относятся ритейлеры с сильной онлайн-составляющей, онлайн-сервисы и e-learning платформы.
  • Неожиданно стремительно падают — спрос снизился почти до нуля, доходы падают. Самое важное для этих компаний — сократить операционные расходы к минимуму, сэкономить каждый доллар, чтобы уберечь бизнес и потерять как можно меньше людей. Уменьшение затрат на поддержку ИТ-инфраструктуры играет важную роль. Именно в этом компании нуждаются в нашей помощи. В категорию попадают, в частности, туристическая отрасль и офлайн-ритейл.
  • Пока стабильные — настоящая ситуация мало повлияла на основной бизнес этих компаний. Но они не знают, что их ждет дальше.

Неопределенность будущего — общая черта для всех категорий. Сейчас никто не знает, как ситуация будет разворачиваться. Это приводит к следующим последствиям:

  1. Даже те компании, которые сейчас в выигрыше, не готовы к значительным трансформациям и инвестиций в ИТ-инфраструктуру. Такие дорогие и сложные услуги, как изменение архитектуры или модернизация программ, в ближайшем будущем будут актуальны только для небольшого количества компаний, требующих диджитал-трансформации. Основная часть старается не рисковать и вкладывать только в том, что принесет мгновенную пользу.
  2. Фокус смещается из долгосрочных стратегий, которые приносят большую выгоду в долгосрочной перспективе (от 1-2 лет), на краткосрочные, результат которых слабее, однако ощутимым уже через несколько месяцев или даже недель.
  3. Приоритетом становится масштабируемость (scalability) и эффективность как инфраструктуры, так и бизнеса в целом. Ведь нынешний, сильно увеличен / уменьшен спрос потенциально вернется к прежнему уровню, как только ситуация стабилизируется. Но может случиться и очередной резкий скачок. Компании понимают, что их инфраструктура должна быстро адаптироваться, чтобы бизнес мог функционировать в различных условиях. Это должно происходить оперативно и без значительных инвестиций (например, без построения датацентра, закупки серверов).

Виртуальный сервер в Облаке — это выход, поскольку его можно арендовать всего за несколько минут и так же быстро от него отказаться. Этот подход все давно знают, но раньше мало кто был готов отказаться от предыдущих инвестиций, переучить персонал, да еще и изменить сотни процессов в компании.

Поэтому выделю несколько ключевых мнений относительно того, куда движется рынок DevOps и Клауд-сервисов.

Оптимизация стоимости инфраструктуры

По данным State of the Cloud Report , в 2020 году 82% энтерпрайз-компаний считают оптимизацию расходов на инфраструктуру в Облаке основным приоритетом. А для более трети из них это большой вызов. С традиционными датацентрами ситуация еще хуже — большинство компаний утверждает, что не является оптимизированными и это приводит к перерасходу около 30% ресурсов.

Мы регулярно получаем от клиентов запросы на эти услуги. Но сейчас оптимизация становится еще более актуальной. Для части компаний это вопрос выживания. И даже те, у кого ситуация более или менее стабильная, понимают, что пришло время пересмотреть свои практики.

Коротко о том, как выглядит оптимизация

Сначала нам нужно понять состояние Облачной-инфрастуктуры клиента на данный момент. Для этого мы изучаем документацию, счета, инструменты, которые компания использует, автоматизацию, проводим интервью ключевых стейкхолдеров. Это позволяет подготовить подробный отчет и на его основе разработать стратегию, обычно охватывает краткосрочный и долгосрочный планы оптимизации расходов.

Что получает клиент? Как показывает практика, реализация краткосрочного плана может сократить бюджет на  15-30%, долгосрочного — на  20-50%. Даже для бизнеса, которые пошли на убыль, оптимизация расходов — это не только вопрос сэкономленных средств, но и инвестиция в том, насколько быстро и эффективно они смогут восстановить процессы, когда ситуация нормализуется и нужно будет возвращаться к активной работе.

Один из наших последних кейсов — клиент тратил более 300 тыс. Долларов в месяц на поддержку Облачной -инфраструктуры в Azure, при том она была достаточно неплохо оптимизирована и использовала большинство best practises. Компания пришла к нам в конце февраля с запросом сократить эту сумму как минимум на 35%, чтобы иметь возможность сохранить команду. По состоянию на конец марта нам удалось уменьшить ее до 243 тыс. Долларов, до конца апреля — до 157 000. Среди основных шагов, которые помогли этого добиться, выделю следующие:

  • Объединили региональные Dev / QA / UAT в один глобальный расшаренный Kubernetes-кластер.
  • Оставили на выделенном пуле серверов только ворклоады, которые плохо переживают перезапуск. Большинство ресурсов в кластере живет на спот-инстансах.
  • С помощью автоматизации перевели большинство QA / UAT на on-demand модель, где среда стартует только тогда, когда оно необходимо, и автоматически останавливается через некоторое время.
  • Внесли много изменений в профиля ресурсов для уменьшения их performance. Это повлияло на такие метрики, как Build Time / Test Time. Но поскольку во время кризиса процесс разработки перешел в режим «только приоритетные продукты», общее количество Комит, билдов уменьшилось, загруженность всей системы тоже снизилась, соответственно Time To Production (Market) почти не изменился.

Вы можете спросить, почему к этой оптимизации пришли только сейчас? Ведь все можно было сделать и в спокойные времена. И вы правы, эту инфраструктуру и процессы стоило оптимизировать уже давно. Часть из этих улучшений была даже заложена в нынешнем плане. К сожалению, только кризис помог бизнеса понять важность эффективности их ИТ-инфраструктуры и процессов. Только угроза потерять этот бизнес подтолкнула наконец приоритезировать время девелоперов на нужные изменения в коде, сфокусировать Автотест и DevOps-команды на разработку нового подхода для тестирования продуктов и инфраструктуры. Уже сейчас менеджмент активно планирует развертывание этого нового подхода на Production, который поможет сэкономить еще примерно 30-40 тыс. Долларов в месяц.

В результате компания будет иметь вдвое больше cost-efficient инфраструктуру, чем до этого.

оптимизация затрат в облакеРасширение инфраструктуры благодаря использованию публичного облака

Ведение основной деятельности в собственных датацентрах имеет значительные недостатки, среди которых высокий TCO (total cost of ownership) при низком ROI (return of investments) и сложность масштабирования мощностей. Поэтому все больше компаний начали переходить на гибридные Облакак. По данным IDG , количество организаций, которые хотя бы одну программу или часть инфраструктуры ведут в публичном Клауде, выросла с 51% в 2011 году до 73% в 2018 году, а сегодня уже превысила 90%. Около 44% организаций уже используют одновременно частные и публичные облака, чтобы предоставлять один из своих сервисов.

Эта тенденция продолжает завоевывать бизнес, поскольку это оптимальный путь повысить эффективность существующей инфраструктуры с точки зрения соотношения затраченных средств к полученному в результате прибыли. Но еще важнее — то, что это теперь не нужно полностью менять структуру своего решения, навыки команд и инструменты управления.

Немало компаний столкнулись с проблемой, что инфраструктура и бизнес в целом не могут отвечать на вызовы настолько быстро, как это нужно. Согласно еще больше компаний и еще быстрее будут переходить на гибридные Клауды. Поэтому этот тренд совсем не нов. Тогда что же изменилось?

Около 2/3 компаний, которые начали переходить на гибридную модель, в Облаке размещали только новые проекты, но не были готовы вкладывать ресурсы в переносе туда основного бизнеса, приносящего больше доходов и на значительно усилилось нагрузки сейчас. В таких случаях гибридное облако выглядит так: весь основной бизнес ведут в датацентре, новые проекты запускают в Клауде, но все равно связываются с датацентр, чтобы использовать те данные, которые в нем хранятся. Соответственно то, что эти компании имеют ресурсы в Клауде, не помогает в ситуации, когда нужно быстро масштабировать основной бизнес.

о мультиклауд

Еще одна актуальная проблема — то, что не только компании переживают рост нагрузки на сервер, но и Облачные-провайдеры. Например, нагрузка на Azure за март увеличилось более чем 700%. Это влияет на его пользователей — некоторые из них очень зависят от доступных ресурсов для short-time bursts. Оптимальное решение в такой ситуации — расшириться на другой публичный Клауд.

Среди крупнейших в Европе пользователей одного из публичных Клауд-провайдеров — онлайн-ритейлер, которому с началом эпидемии нужно было быстро расширить бизнес. Но он столкнулся отсутствием свободных ресурсов в датацентрах своего Клауд-провайдера. Поэтому вернулся к мультиклауд-стратегии, которую мы предлагали ему в прошлом году. Теперь мы строим для этой компании решение, которое в краткосрочной перспективе поможет переводить часть нагрузки на Облако другого провайдера. А в долгосрочной перспективе позволит свободно балансировать сервисы между несколькими провайдерами.

Что эти изменения означают для DevOps-инженеров

Сейчас не появляются новые технологии или тенденции, но меняется фокус и ускоряются те изменения, которые начались уже давно. Поэтому инженеры должны быть готовы к этому, должны учиться, приобретать новые умения.

С ключевого: экспертиза в работе с Облаками и контейнерными платформами — must have, без этого трудно найти проект. Не очень отдаленная перспектива — решение для гибридных / мультиклаудов и Workload Mobility: Google Anthos, OpenShift и VMware Taznu.

Планируете переезд в облако обращайтесь, мы поможем спроектировать и внедрить решение, а если уже используете облако, мы можем оптимизировать затраты.