В фокусе:
Медиахолдинг
КЛИЕНТ
Медиахолдинг из ТОП-5 в России (ТВ, радио, интернет и др.)
КРАТКО
Создание системы зонтичного мониторинга информационно-технологического ландшафта в связке с системой учета ИТ-активов
МАСШТАБ
7
систем технологического мониторинга и управления интегрированы в инфраструктуру
Результат
Контроль всех основных метрик функционирования ИТ-среды

Заказчик

Заказчик — крупный мультимедиа холдинг, производящий современные медиапродукты и доставляющий их с использованием всех основных средств вещания (телевидение, интернет, радио) до потребителей на всей территории Российской Федерации.

Компания-заказчик входит в ТОП-5 медиакомпаний России и работает на этом рынке на протяжении многих лет. Обладает развитой информационно-технологической и сервисной инфраструктурой.

Предпроектная ситуация

В ходе развития ИТ-инфраструктуры заказчика за несколько десятков лет внедрено множество разрозненных средств мониторинга и управления ИТ-инфраструктурой, виртуализацией, серверным и телекоммуникационным парком.

«Лоскутная» автоматизация привела к тому, что единое представление о текущем и прогнозируемом состоянии инфраструктуры сформировать невозможно, оповещения от систем мониторинга периодически теряются, т. к. отсутствует единая политика оповещения и реакции, а настройка и актуализация данных требует значительных затрат времени технического персонала.

Из-за разрозненных данных отсутствует возможность отслеживать KPI ИТ-услуг и завязанных на них бизнес-услуг, планировать работы по обслуживанию инфраструктуры и интегрировать процессы мониторинга с остальными ИТ-процессами.

Для устранения этих проблем был выбран продукт Naumen Business Services Monitoring, который тесно интегрирован с решением для управления ИТ-активами (Naumen ITAM) и сервисной деятельностью (Naumen Service Desk Pro) и позволяет автоматизировать процесс зонтичного мониторинга в единой среде с сервисными процессами.

Цели и задачи

Основные цели проекта:

  1. Создание единого центра управления ИТ-инфраструктурой.
  2. Повышение доступности ИТ-услуг и качества их предоставления для бизнеса.
  3. Снижение затрат на эксплуатацию и развитие систем мониторинга и управления.
  4. Повышение прозрачности учета и потребления ресурсов ИТ-ландшафта.

Задачи проекта:

  1. Сбор разнородных данных из 7 систем мониторинга и управления ИТ-инфраструктурой в едином центре (системе зонтичного мониторинга).
  2. Интеграция данных о функционировании элементов ИТ-ландшафта с данными учетной системы (Naumen ITAM) и системы управления процессами обслуживания (Naumen Service Desk Pro).
  3. Построение практики управления событиями (Event Management) по модели ITIL.

Концепция проекта

Для достижения целей проекта было принято решение включить в состав интегрируемых систем мониторинга и управления следующие источники:

  • Системы мониторинга:
    • Zabbix (программное обеспечение для контроля работоспособности различного серверного, сетевого оборудования, которое нельзя контролировать другими ПО);
    • Microsoft System Center Operations Manager (программное обеспечение для контроля работоспособности ПО, созданного на базе Microsoft);
    • CA Spectrum (программное обеспечение для контроля работоспособности сетевого оборудования — NMS-система);
  • Системы управления:
    • VMware vCenter (программное обеспечение для управления виртуальными серверами и сервисами);
    • Hewlett-Packard Systems Insight Manager (программное обеспечение для контроля работоспособности оборудования фирмы Hewlett-Packard);
    • EMC Monitoring and Reporting Services (программное обеспечение для контроля работоспособности систем хранения данных от производителя EMC и Dell);
    • NetApp OnCommand Unified Manager (программное обеспечение для контроля работоспособности систем хранения данных от производителя NetApp).

Дополнительным источником информации выступила сама платформа Naumen DAP, которая позволяет настраивать сценарии проверки сервисов и триггеры на метрики, полученные из интегрируемых систем.

В рамках параллельного проекта внедрения Naumen ITAM была выстроена ресурсно-сервисная модель ИТ-услуг. В нее входит диаграмма взаимовлияния элементов ИТ-инфраструктуры и их роли в оказании целостного сервиса для бизнес-заказчика, что выступает каркасом построения правил реакции на события в инфраструктуре.

В свою очередь, Naumen Business Services Monitoring выступил источником первичных данных для ITAM. С его помощью автоматически вносятся в систему сведения об объектах мониторинга в качестве объектов автоматизированной инвентаризации (ОАИ), подтверждающих и дополняющих ИТ-активы. На основе этой информации создано целостное видение ИТ-актива: со стороны инфраструктуры (ОАИ), конфигурации (КЕ) и финансовых параметров (собственно, актив).

Для каждого из ИТ-активов через связку ОАИ, полученных из одной или нескольких систем мониторинга, формируется оценка 360-view. При этом в систему зонтичного мониторинга передаются как «сырые» метрики устройств (потребление CPU или памяти, доступность, запущенные процессы и др.), так и все возникающие в системах мониторинга информационные события и отклонения. Помимо этого, на основании информации систем управления актуализируются связи между элементами ресурсно-сервисной модели (например, при миграции виртуальной машины между физическими кластерами).

Для каждого актива в зависимости от его классификации и места в ресурсно-сервисной модели формируется шаблонизированный дашборд, который отражает текущее состояние здоровья и нагрузки элемента инфраструктуры.

В итоге все выявленные события передаются в процесс управления событиями.

Процесс управления событиями

Процесс управления событиями (Event Management) — одна из базовых практик ITIL, цель которой выявить все происходящие в инфраструктуре события и отреагировать на них до того, как целостный сервис понесет ущерб, а проблема будет обнаружена конечным пользователем.

Механизмы управления событиями на основании процессных правил, которые настраиваются индивидуально для каждой из ИТ-услуг, производят обработку события:

  1. Унификацию (приведение к единому виду разнородных событий).
  2. Классификацию (определение первопричины события — «Ситуации» — и его критичности).
  3. Корреляцию (отражение события на ресурсно-сервисную модель ИТ-услуги).
  4. Реакцию (запуск процессной активности — массового или единичного инцидента, запроса на обслуживание или запроса на изменение).

После запуска процессной активности «судьба» события отслеживается и дальше, к примеру, если система мониторинга пришлет закрывающее событие («работоспособность восстановлена»), ответственный за запрос инженер получит информацию об этом.



Результаты проекта

Достижения проекта:

  • Построен единый «центр управления ИТ-услугой», который объединяет сервисные и технические показатели ИТ-услуг;
  • Выстроен процесс управления событиями, исключающий ситуации несвоевременной или неадекватной реакции на происходящие в инфраструктуре процессы;
  • Поддержано внедрение ITAM за счет наполнения базы данных ОАИ актуальной информацией из систем мониторинга.

Ключевые бизнес-результаты:

  • Сокращение количества инцидентов в ИТ-инфраструктуре за счет своевременной и качественной реакции на события;
  • Сокращение трудозатрат инженеров на поддержку систем мониторинга, обработку событий и инцидентов;
  • Обеспечение актуальности CMDB и ITAM, упрощение построения ресурсно-сервисных моделей.