и управления ИТ-ландшафтом предприятия
Искусственный интеллект для мониторинга ИТ-инфраструктуры : с какими задачами модель справится сегодня
В этой статье рассмотрим, как использовать модели искусственного интеллекта в мониторинге
Предотвращение сбоев в работе оборудования
Такую возможность дают модели машинного обучения (
Прогнозирование значений метрик.
Для прогнозируемых значений в системе мониторинга действуют все те же возможности, что и для собираемых в текущий период. В частности для них аналогично настраиваются механизмы реагирования. Допустим, модель спрогнозировала, что через 1 час метрика достигнет порогового значения. Это повлечет срабатывание триггера, и система отправит уведомление специалистам, которые отвечают за данное оборудование.

Модель в системе мониторинга Naumen BSM обновляет прогноз метрик с заданной периодичностью на основании постоянно обновляемых значений метрик
Обнаружение аномальных значений метрик. Значения постоянно меняются, и это нормально. Тем не менее колебаться они могут только в определенных рамках. Выход за них означает возможный сбой.
В этом случае система не бьет тревогу сразу, а берет метрику под контроль. Если ее значение возвращается к нормальным показателям, например, такое возможно, если оборудование было перегружено на короткий промежуток времени, то отклонение считается случайным. Если нет, и метрика продолжает демонстрировать аномальные значения, система оповещает об этом ответственных и создает инцидент.
Этот сценарий также дает

ИИ-модель в Naumen BSM учитывает, что аномалия может носить случайный характер, поэтому сообщает о ней только убедившись, что она действительно важна
Таковы на данный момент реальные и проверенные возможности ИИ, которые уже применяются для мониторинга
Выявление неоптимального распределения ресурсов
Если предоставить
Таким образом загрузка
Планирование ИТ-мощностей
При наличии исторических и актуальных данных об использовании
Так как модель оперирует данными конкретной инфраструктуры, то автоматически учитывает именно ее особенности. Поэтому рассчитает необходимые ресурсы, именно для данной компании. Применение такого алгоритма позволит не только быстрее планировать и реализовывать запуск новых мощностей, но и точнее бюджетировать затраты на это.
Выяснение причин инцидентов
РСМ — это схема, которая отражает связи между сервисами, услугами и объектами
Тем не менее в инфраструктуре много непрямых и неочевидных связей, которые сложно отследить по
Автоматическая работа с триггерами
Триггеры — это настроенные в системе мониторинга значения метрик, при которых автоматически запускаются определенные сценарии: отправляются оповещения ответственным, формируется инцидент
Но скоро интеллектуальные системы смогут взять ее на себя. Для этого им понадобится история значения метрик, триггеров и информация о составе инфраструктуры. Сопоставление всех этих данных позволит
К выводам
Главная возможность
В ближайшем будущем модели смогут обрабатывать данные по составу и загрузке инфраструктуры и сопоставлять их с метриками. И это откроет новые возможности по предотвращению сбоев, недоступность сервисов, простою
Что еще интересного
Что такое автоинвентаризация, управление событиями и анализ метрик.
Ускоряем диагностику сбоя и прогнозируем события в инфраструктуре.
Как упростить сбор данных из внешних систем и быстро чистить базу данных событий и аварий.
