Проекты ООО «СервисТелеком» и Network Manager
КОМПАНИЯ
ООО «СервисТелеком»
КРАТКО
Проект централизации мониторинга ИТ-инфраструктуры с помощью решения Naumen Network Manager.
РЕЗУЛЬТАТЫ
  • Онлайн-мониторинг актуального состояния сервисов
  • Сокращение сроков реагирования на   инциденты
  • Автоматический контроль SLA

ПРОФИЛЬ КОМПАНИИ

ООО «СервисТелеком» — российская сервисная компания, обладает статусом эксклюзивного сервисного центра ОАО «Российские железные дороги». Оказывает заказчикам услуги по техподдержке, обслуживанию и ремонту телекоммуникационного и сопутствующего оборудования интегрированной сети связи.

ПРЕДПОСЫЛКИ ПРОЕКТА

Ранее компания не использовала централизованное решение для мониторинга собственной инфраструктуры. Это затрудняло обеспечение непрерывности внутренних бизнес-процессов в условиях существенного роста собственной ИТ инфраструктуры. Даже незначительный простой оборудования мог привести к финансовым потерям и репутационным рискам.

Для достижения поставленных целей, потребовалась универсальная система мониторинга, которая способна агрегировать данные о работе сетевой инфраструктуры, ИТ-оборудования, программного обеспечения и прочих технологий.

Ключевыми критериями, на который ориентировалась компания при выборе системы стали: автоматическое обнаружения инфраструктуры по расписанию, для решения задач масштабирования и выявления новых устройств в сети, проактивный мониторинг с возможностью как тестирования узлов инфраструктуры, так и прогнозирование возможных инцидентов, интуитивно понятный интерфейс для работы с системой и гибкий инструмент настройки и создания дашбордов/отчетов.

ЦЕЛИ ПРОЕКТА

  • Повышение надежности инфраструктуры.
  • Бесперебойная работа ключевых услуг.
  • Сокращение времени реакции на инциденты.
  • Оптимизация затрат на поддержку ИТ-ландшафта.

О ПРОЕКТЕ

Внедрение Naumen Network Manager реализовали за 5 месяцев. За это время выполнили работы для постановки на мониторинг всех компонентов ИТ-инфраструктуры в автоматическом режиме.

Выполнили интеграцию с Active Directory и настроили разграничение прав по группам согласно ролевой модели. После авторизации в системе пользователям доступны только те данные, которые необходимы для работы.

Протоколы опросов. Для сбора данных метрик различных элементов ИТ-инфраструктуры используются протоколы SNMP (Simple Network Management Protocol) и ICMP (Internet Connection Management Protocol).

По протоколу SNMP автоматически собирается большое количество данных с каждого устройства. При настройке протокола определяется оптимальная частота обновления каждой метрики. Это позволяет получать актуальные данные о состоянии устройств, но при этом не перегружать систему. А по протоколу ICMP постоянно собираются показатели одной метрики — метрики доступности, которые отслеживают работоспособность устройств в режиме онлайн.

Дискаверинг. Обнаружение устройств и сбор данных об ИТ-инфраструктуре выполняется автоматически. Настроено расписание, по которому опрашиваются целевые диапазоны IP-адресов. При выявлении новых хостов, то есть при подключении к сети нового ПО или техники, система подбирает подходящий шаблон опроса из готовой библиотеки и определяет устройство. Затем обнаруживает, как связано оборудование с другими ИТ-элементами. При этом отслеживаются не только физические, но и логические уровни связи.

Реализован автодискаверинг агентского ПО, которое развернуто на оборудовании и предназначено для сбора данных мониторинга. При обнаружении агента в систему автоматически добавляется информация об устройстве и настраивается сбор метрик.

Ресурсно-сервисные модели (РСМ). Выстроены модели, которые включают в себя не только устройства и ПО, но и различные компоненты оборудования — конфигурационные единицы. Благодаря инструменту удалось улучшить контроль доступности услуг. Например, РСМ «Процент использования картриджей» отображает среднюю заполненность всех картриджей в компании. Данные такой РСМ можно учитывать при оценке состояния здоровья услуги «Печать».

Мониторинг телефонии. Для проверки доступности телефонных номеров внедрен модуль SIP-проб. Система автоматически совершает звонки на внутренние номера компании, а по результатам делает вывод о доступности конкретных номеров и услуги телефонии в целом.

Триггеры. Определены пороговые значения для критически важных метрик. На основе механизма порогов (триггеров) автоматизирована обработка аварийных событий.


Оповещения о сбоях. Автоматизирован процесс уведомления ответственных сотрудников о критических событиях в ИТ-инфраструктуре. Сообщения отправляются по электронной почте и в Телеграм. Специалисты узнают об авариях сразу, что позволило увеличить скорость реагирования на инциденты.

Контроль SLA. С помощью ресурсно-сервисных моделей обеспечивается сбор данных мониторинга для подтверждения выполнения SLA. Для каждой услуги автоматически рассчитываются ключевые метрики: среднее время восстановления, MTBF («наработка на отказ») и уровень доступности в процентах.

Дашборды. Настроены информационные панели для разных задач. Так, для оперативного мониторинга ИТ-инфраструктуры используется кастомный дашборд доступности устройств. На одном экране отображается актуальное состояние всех компонентов ИТ-инфраструктуры. Также предусмотрены готовые дашборды для руководителей. Благодаря встроенной аналитике повышена эффективность при планировании используемых ресурсов, замене или расширение парка устройств, оптимизирована загрузка оборудования.


РЕЗУЛЬТАТЫ ПРОЕКТА

  • В  автоматическом режиме отслеживается состояние порядка 200 устройств.
  • Внедрена единая политика настройки метрик и  триггеров для дальнейшего применения на  всех участках ИТ-инфраструктуры.
  • Настроены отчеты и  сбор данных для  подтверждения выполнения SLA.
  • Аналитические инструменты помогают выявлять неэффективно используемые ресурсы, оптимизировать загрузку оборудования, точнее планировать потребности в  замене ИТ-парка.

Мы выбрали Naumen Network Manager как универсальную систему, которая умеет проводить мониторинг любого оборудования и ПО. Для нас значимо, что система обеспечивает прозрачность в работе с инфраструктурой, имеет встроенный функционал автоматического обнаружения для автоматизации задач масштабирования, проактивного реагирования на события и предоставляет доступ к значимым данным, хранимым в исторической БД, с возможностью в любой момент провести аналитику по выбранным сегментам сети. Принципиальный аспект, что продукт входит в реестр отечественного ПО 

Иван Наумов, технический директор «СервисТелеком»

Перспективы

В планах — включить в контур проекта все элементы ИТ-инфраструктуры для автоматического контроля систем и услуг. Кроме того, провести инвентаризацию и картографию инфраструктуры: составить карты серверов, сетевых устройств, сервисов. Последующая интеграция с системой класса Service Desk поможет в настройке механизмов реагирования на аварийные события.

Технологии Naumen позволили заказчику решить все стоящие перед ним задачи в области контроля и масштабирования инфраструктуры, повысить эффективность использования ИТ-ресурсов, а также применить единую политику настройки метрик и триггеров, что обеспечивает оперативный мониторинг и прогнозирование возникновения новых инцидентов.

Иван Гурошев, владелец продукта Naumen Network Manager