Мониторинг микросервисов: зачем это нужно
5 (100%) 5 votes

После заключительного этапа разработки продукта в сфере ИТ-услуг, необходимо проводить регулярный мониторинг его состояния. Но как быстро решить внезапно появившуюся проблему, если ПО состоит из множества внешних зависимостей? Если подойти к задаче необдуманно, дальнейшая поддержка продукта может и вовсе прекратиться.

Итак, если ПО состоит из множества зависимостей, то куда логичнее отталкиваться от аналитики микросервисов. С помощью такого мониторинга можно быстро найти первоисточник проблемы и устранить её ещё до того, как это заметят сами пользователи.

С чего начать

Основная идея данного подхода состоит в постоянном мониторинге серверов. Один из его особых методов называется «проактивным». С его помощью можно получать телеметрические данные, которые генерируются из работающих сервисов и помещаются в хранилище. Вся полученная информация анализируется с целью выявления неполадок, как в отдельных частях, так и во всей системе.

Также нужно облегчить работу сотрудникам: дать возможность провести анализ без подключения к сервисам. Подобный способ администрирования серверов ускорит обслуживание ПО. Но если мы получаем огромное количество данных, то как их отфильтровать по значимости, чтобы иметь четкое представление о происходящем?

Составим несколько принципов для правильного мониторинга, исходя из вышеуказанных требований:

  1. Необходимо обеспечить SLA (соглашение о качестве сервиса) для каждого сервиса.
  2. Необходимо анализировать входящие запросы сервисов вместе с параметрами их реакции.
  3. Необходимо анализировать исходящие запросы от одних сервисов к другим вместе с параметрами их реакции.

Обеспечение SLA

Данный сервис важен с точки зрения удовлетворения пользователей предоставляемыми ИТ-услугами. С помощью SLA они будут иметь четкое представление о том, с чем им приходится работать и отвечает ли используемый продукт их требованиям. За счет доступности описания и использования общих параметров, все это можно использовать и для других сервисов.

Речь идет о параметрах SLI (параметры качества сервиса), о которых вы можете в деталях узнать на Wikipedia.

Итак, после определения параметров качества и сбора необходимых данных, можно приступить к определению их диапазонов допустимых значений. Изначально нужно отталкиваться от общепринятых норм, а затем определить, какие отклонения от них допустимы для вашего продукта. Важно учесть все свойства ПО и те пункты, которые важны для бизнеса.

Далее необходимо определить SLO (измеримые характеристики сервиса). Например, вам нужно, чтобы продукт работал на протяжении всего года, а скорость ответа на запрос не превышала лимит в 300 млс. С помощью таких ограничений можно четко составить план дальнейшей оптимизации продукта и выявить недостатки.

После этого, решаем вопрос с SLA. Важно отметить, что эти параметры определяются после проведения нагрузочного теста, мониторинга серверов и оценки их работоспособности.

Мониторинг входящих запросов

Администрирование серверов необходимо для мониторинга входящих запросов с целью определения степени нагрузки.

Аналитика проста: считаем количество входящих запросов, отмечаем скорость отклика, а затем определяем, в каких случаях работоспособность не соответствует требованиям. Важно учесть каждый отдельный случай на каждом сервисе, а также проследить за их взаимодействием. Без этого мониторинга велик риск критических сбоев, на которые сотрудники не смогут отреагировать оперативно.

Мониторинг исходящих запросов

Исходящие запросы не менее важны. Они отслеживаются во время обращения одно сервиса к другому, в том числе и к базам данных, кэшам и т.д. Параметры мониторинга те же: объем исходящих запросов и их длительность.

Не стоит считать данный мониторинг излишним, так как с его помощью можно наблюдать за нарушениями со стороны пользователей, защищаясь от потенциальных проблем. Нередки случаи, когда сторонние сервисы, связанные с вашим продуктом, перестают отвечать на запросы. Тогда вы можете сообщать пользователям о наличии проблем, которые никак не относятся к вам.

Мониторинг сервисов и их исходящих запросов также позволяет составлять статистику активности и сопоставлять её с деятельностью компании в целом.

Итог

С помощью грамотного администрирования серверов, можно значительно повысить эффективность проводимых работ и оперативно решать возникающие проблемы. Помимо этого, вы дадите своим пользователям возможность видеть исходные параметры ПО, повышая уровень доверия.

Мы готовы предоставить услуги профессионального мониторинга серверов и сайтов. Пишите нам [email protected]