CMDB и управление инцидентами ITIL: полное руководство
От стабильной работы
В этой статье рассмотрим методики, инструменты и практики, направленные на улучшение работы
Содержание
Что такое управление инцидентами в IT
Методология ITIL: основы и процессы
CMDB: база данных конфигураций и ее роль в ITSM
Процесс управления инцидентами по ITIL: пошагово
Как CMDB поддерживает управление инцидентами
Российские системы CMDB и ITSM: что выбрать
Кейсы внедрения ITIL и CMDB в российских компаниях
Типичные ошибки при внедрении CMDB и как их избежать
Чек-лист: готовность к внедрению CMDB
Случается так, что в инфраструктуре
Определение Incident Management
Инциденты в
Управление инцидентами — один из важнейших процессов, направленный на починку небольших поломок, пока они не переросли в глубокие проблемы, которые прерывают оказание
Представим, что произошел сбой в
Что происходит дальше:
- Менеджер отдела продаж создает заявку в Service Desk с описанием проблемы.
- Новому инциденту присваивается категория «Отказ системы», приоритет «Критический», поскольку затронут ключевой
бизнес-процесс . - Специалист первой линии поддержки проверяет базу знаний и находит быстрое решение (например, очистка кэша). Это не срабатывает, поэтому инцидент эскалируется на вторую линию.
- После дополнительной проверки на второй линии поддержки выясняется, что на сервере закончилось свободное место.
- Сотрудники отдела продаж получают электронные письма, в которых сообщаются примерные сроки восстановления доступа к CRM.
- Системные администраторы проводят работы, чтобы расширить свободное пространство на диске. В результате доступ к CRM удается восстановить.
- Затронутым пользователям приходят письма с подтверждением, что в CRM снова можно зайти. Заявка получает статус «Выполнено».
- После устранения сбоя
ИТ-инженеры разбираются, почему не сработал мониторинг свободного места на диске. Решают настроить специальные оповещения, чтобы ситуация не повторилась в будущем.
Процесс управления инцидентами помогает восстановить работоспособность инфраструктуры и принять меры, чтобы не допустить новых сбоев
Важность эффективного управления инцидентами для бизнеса
Неожиданные сбои в
Рассмотрим ключевые выгоды управления инцидентами.
Минимизация простоев и убытков. Бизнесу дорого обходится любой простой. Ущерб можно рассчитать, сложив затраты на ФОТ, ресурсы, которые потребовались для устранения ошибок или ремонта оборудования. Быстрое реагирование на сбои снижает время простоев, сокращает незапланированные затраты.
Защита публичного имиджа. Сбои приносят репутационные потери, например, если нестабильно функционируют приложения, которыми пользуются клиенты. Надежность
Повышение качества обслуживания. Если у
Оптимизация работы специалистов. Отсутствие единых процессов и приоритетов приводит к неэффективности, мешает инженерам сфокусироваться на критически важных задачах, которые влияют на непрерывность бизнеса. Четко определенные роли и процедуры исключают хаос, помогают
Контроль над инцидентами помогает сделать организацию сильнее и повысить ее экономическую эффективность
Управление инцидентами относят к реактивному процессу.
Методология ITIL: основы и процессы
Управлять инцидентами эффективнее помогают методические рекомендации, описанные в ITIL. Рассмотрим, как с их помощью объединить работу
Что такое ITIL
Методология ITIL (Information Technology Infrastructure Library) — это лучшие и передовые практики по управлению сервисами и услугами.
Цели ITIL:
- выстраивание эффективной работы
ИТ-отдела ; - повышение ценности и надежности
ИТ-услуг в организации; - максимальная окупаемость инвестиций бизнеса в ИТ.
Важно не путать методологию ITIL и практику ITSM (IT Service Management). Первое является источником теоретических знаний, а второе — реализованный процесс управления
Последняя версия ITIL — четвертая — вышла в 2020 году. Разберем, в чем ценность применения этих рекомендаций подробнее.
Ключевые процессы ITIL 4
ITIL позволяет построить прозрачную систему сервисного обслуживания. Такая система охватывают не только
Методология описывает принципы управления 34 процессами. Основные из них — практики по управлению инцидентами, изменениями, проблемами, событиями и мониторингом, знаниями, уровнем услуг, конфигурациями и активами, доступами, релизами, а также обслуживанием. При использовании ITIL стоит учитывать, что это не пошаговая инструкция. Рекомендации нужно адаптировать, ориентируясь на уровень зрелости
Обеспечение работоспособности и доступности сервисов и услуг достигается с помощью функций. Принято считать, что они равнозначны структурным подразделениям. Например, первая, вторая и третья линии поддержки — это определенные функции.
Однако функция в ITIL — это не только люди, а вообще все, что потребуется для поддержки процессов, в том числе инструменты и другие ресурсы. Каждая функция решает определенные задачи, но не всегда эти задачи относятся к
Роль управления инцидентами в ITIL
Управление инцидентами занимает ключевое место в ITIL, поскольку от него зависит восстановление стабильной работы организации. Рекомендации ITIL позволяют выстроить процесс эффективно: быстро обнаруживать и классифицировать инциденты, находить первопричины и оптимальные (в том числе по стоимости) пути решения, повысить скорость устранения. Один из инструментов, который играет важную роль в процессе управления инцидентами, называется CMDB.
CMDB: база данных конфигураций и ее роль в ITSM
CMDB — это специальные базы, которые позволяют внедрить комплексный подход к контролю инфраструктуры, а также вести учет
Что такое CMDB и конфигурационные единицы (КЕ)
Если говорить в терминах ITIL: CMDB (Configuration Management Data Base) — это база данных управления конфигурациями, которая включает в себя все элементы
Одна из главных особенностей CMDB — это возможность вести учет не только оборудования и ПО, но и конфигурационных единиц (КЕ).
КЕ могут выступать конкретные устройства и их составляющие, а также группы различных компонентов. Например, КЕ «ноутбук» включает в себя: процессор, батарею, видеокарту. В то же время сам ноутбук — часть КЕ «автоматизированное рабочее место сотрудника», в которое также входят: корпоративный софт, мышь, дополнительный монитор, видеокамера и другое.
По мере повышения зрелости
Различные типы содержащихся в CMDB данных обеспечивают полное и корректное представление об инфраструктуре организации
Как CMDB связана с процессами ITIL
CMDB выступает основой для некоторых процессов ITIL. В базе содержится вся информация о КЕ, включая данные о событиях, ремонтах и профилактических работах, документах и соглашениях, а также взаимосвязи с другими компонентами. Благодаря этой информации и появляется возможность выстраивать сервисные процессы.
С помощью CMDB можно построить
Так, в процессе управления конфигурациями обеспечивается стабильность систем и устройств. В управлении изменениями CMDB дает возможность проанализировать влияние изменений на работу
В методологии ITIL понятие CMDB описывается во множестве практик и процессов: управление конфигурациями,
Согласно ITIL 4 и
Преимущества внедрения CMDB для бизнеса
Основным эффектом становится устранение разрозненности. База содержит стандартизированные данные о компонентах инфраструктуры. Информация регулярно обновляется, что позволяет избежать ее устаревания.
Главные причины для компании использовать CMDB:
- Повышение эффективности
ITSM-процессов за счет точной информации о конфигурационных единицах, взаимосвязях между ними. - Оптимизация
ИТ-расходов . Анализ того, как применяется оборудование и ПО, позволяет управлять мощностями и ресурсами, выявлять неактивные объекты инфраструктуры, обоснованно планировать бюджет и рассчитывать стоимость услуг. - Ускорение изменений, снижение рисков. Появляется возможность прогнозировать негативное и позитивное влияние, лучше планировать технические работы.
База данных управления конфигурацией помогает сформировать такую инфраструктуру, которая соответствует текущим потребностям компании.
Процесс управления инцидентами по ITIL: пошагово
В ITIL описаны практические рекомендации по организации процесса управления инцидентами. Весь процесс разбивается на несколько этапов. Разберем подробнее.
Перечень этапов управления инцидентами по методологии ITIL
Этап 1: Выявление и регистрация инцидента
Отправка заявки о возникновении проблем поступает в службу поддержки из разных источников. От пользователей — по почте, в мессенджерах или чате, через заявку на корпоративном портале. Или от систем мониторинга, которые фиксируют сбой и присылают уведомления ответственному за устройство или услугу.
Затем инциденты регистрируются в специализированной системе. Этот процесс значительно ускоряется благодаря CMDB, поскольку поломки автоматически связываются в системе Service Desk с конкретными элементами инфраструктуры. При создании новой записи об инциденте специалисты видят полный контекст: кто пользователи, какое ПО и оборудование затронуто, какая конфигурация, текущее состояние.
Этап 2: Классификация и приоритизация
Следующий шаг по ITIL — это классификация инцидентов. Они разделяются на группы в зависимости от критичности: высокая, средняя, низкая.
При приоритизации учитываются технические и финансовые последствия, масштаб сбоя. Также категория инцидента может зависеть от типа
В зависимости от типа инциденту назначаются время реагирования, срок решения. Также на этапе классификации определяется, кто именно будет заниматься инцидентом.
Этап 3: Расследование и локализация
Назначенные ИТ-специалисты получают уведомление об инциденте. Сначала проводят первичную диагностику: анализируют уведомления из систем мониторинга, изучают историю ремонтов и обслуживания оборудования, а в случае нехватки данных опрашивают инициатора заявки.
В локализации инцидентов также помогают
Затем подтверждается предварительная гипотеза или выдвигаются новые предположения. Разрабатывается план решения в зависимости от возможных причин сбоя. Заинтересованным пользователям отправляются уведомления о примерных сроках восстановления работоспособности услуги.
Этап 4: Решение и восстановление сервиса
На этом этапе специалисты устраняют поломку. Для работы пригодится документация, которая хранится в
При планировании необходимых изменений используют
После решения инцидента корректность работы оборудования тестируют. Если все штатно, пользователям сообщают о восстановлении сервиса.
Этап 5: Закрытие и анализ инцидента
После устранения неполадки оператор Service Desk закрывает заявку в системе. Если информация об инциденте была получена от пользователя, ему направляется уведомление о том, что инцидент решен, и просьба поставить оценку.
В ITSM-системе этот процесс автоматизирован. Можно настроить так, чтобы окончательное закрытие заявок происходило после согласования пользователем или спустя некоторое время после отправки оповещения. Если пользователь не согласен с тем, что инцидент устранен, то есть возможность отправить заявку на доработку.
Роли и ответственность в процессе
Работают с запросами один или несколько специалистов, причем они могут входить в разные команды.
| Роли | За что отвечает |
|---|---|
| Пользователь | Инициирует или самостоятельно регистрирует заявку, которая запускает процесс. |
| Первая линия поддержки | Получает и обрабатывает все зарегистрированные запросы. Обычно умеет решать часто встречающиеся проблемы. Сложные запросы эскалирует более компетентным специалистам. |
| Вторая линия поддержки | Обладает более глубокими знаниями, обрабатывает сложные запросы пользователей. Также получает обращения от первой линии. |
| Третья линия поддержки | Это узкие технические специалисты, которые могут выявить и исправить проблему: разработчики, инженеры, системные администраторы. К ним обычно эскалируются запросы от операторов второй линии. |
| Менеджер по инцидентам | Координатор действий, связанных с решением инцидента, а также управляющий процессом. |
Четкое распределение ролей и ответственности помогает быстрее реагировать на инцидент. Участники
KPI и метрики эффективности управления инцидентами
Благодаря ключевым показателям организация может оценивать эффективность, производительность и качество работы по решению инцидентов.
Некоторые метрики позволяют оценить работу сотрудников, осуществляющих управление инцидентами. Чаще всего для этого используются показатели, связанные с соблюдением SLA. Например, скорость реагирования на инцидент, скорость ликвидации сбоя, количество заявок на инцидент с просрочкой дедлайна, количество обращений, решенных в срок. Обычно отслеживаются метрики по команде в целом и каждому сотруднику в отдельности.
Примеры качественных KPI:
- Количество инцидентов за период. Метрика рассматривается в динамике, например, сравниваются значения по неделям или месяцам. Это позволяет увидеть изменения показателя и оценить эффективность мер, направленных на снижение количества инцидентов.
- Общее время работоспособности сервисов. Показывает совокупное количество времени, когда данный сервис функционировал без сбоев. Позволяет выявить самые нестабильно оказываемые услуги.
- Среднее время работоспособности сервисов между инцидентами. Показывает, как часто пользователи сталкиваются со сбоями сервиса. С помощью показателя можно оценить качество решения инцидентов или необходимость внедрения изменений, например, если сбой возникает по одним и тем же причинам.
Какие именно метрики выбрать, зависит от специфики и целей бизнеса. Например, если цель — сокращение времени простоев, в первую очередь стоит рассматривать скорость устранения инцидентов, показатели работоспособности сервисов.
С помощью показателей можно не только отслеживать эффективность решения инцидентов командой поддержки. Также можно выявлять проблемы в
Как CMDB поддерживает управление инцидентами
CMDB играет большую роль в процессе управления инцидентами. Она предоставляет единую карту
Локализация сбоев через ресурсно-сервисные модели
Благодаря CMDB ИТ-подразделение получает исчерпывающую информацию не только о местонахождении оборудования, но и соответствующих конфигурациях. Это дает техническим специалистам возможность быстрее устранять сбои, а также решать вопросы пользователей.
Допустим, в работе сервера произошел сбой. Сотрудник поддержки с помощью CMDB узнает, какие сервисы зависят от этого оборудования. Зачастую это дает понимание характера проблемы еще до полноценной диагностики. Например, новый запуск приложения, кратно увеличил нагрузку и «положил» все остальные сервисы.
Прогнозирование и предотвращение инцидентов
Организация имеет возможность использовать данные CMDB для выявления закономерностей и скрытых проблем, моделирования вероятных последствий. Это позволит своевременно обновлять оборудование, внедрять необходимые изменения и исправлять разные ошибки.
Кроме того, получится:
- Оценивать влияние изменений на инфраструктуру в целом, чтобы предотвращать инциденты.
- Прогнозировать, к каким последствиям приведет перестановка или замена оборудования, обновление систем.
- Находить оптимальные решения проблем в кратчайшие сроки. В
ИТ-системе могут храниться истории ремонтов и обслуживания, примеры решения похожих инцидентов и инструкции. - Анализировать отчеты об инцидентах, чтобы принимать меры, направленные на уменьшение вероятности возникновения поломок в будущем.
ITSM-система предоставляет инструменты, чтобы визуализировать исторические данные о характере и количестве поломок, затронутых КЕ и услугах. Специалистам это помогает делать прогнозы на основе конкретной информации и вовремя начинать действовать.
В опоре на данные из CMDB можно составлять отчеты, которые позволяют обнаруживать уязвимые места в инфраструктуре. Например, узнать, какие модели устройств ломаются чаще всего
Автоматизация процессов с помощью CMDB
Сегодня невозможно предоставлять сервисное обслуживание и ИТ-услуги конкурентного уровня без решений классов Help Desk или Service Desk. CMDB может стать важной частью этих систем. Такая разработка базы данных позволяет в автоматическом режиме:
- Консолидировать и стандартизировать всю информацию, связанную с
ИТ-инфраструктурой , в единой базе. - Отслеживать взаимосвязи между различными конфигурациями оборудования, ПО.
- Управлять ресурсами и мощностями. Прогнозировать необходимость модернизации ресурсов, чтобы избежать инцидентов, связанных с нехваткой производительности.
Интеграция CMDB с системами мониторинга позволяет отправлять оповещения о критическом сбое для конкретной
Российские системы CMDB и ITSM: что выбрать
Функциональность российских
Рассмотрим, какой должна быть
Критерии выбора системы для enterprise и госсектора
Подходящее решение должно соответствовать требованиям информационной безопасности, обеспечивать высокую производительность, предоставлять широкий выбор инструментов для управления
| Основные критерии выбора | Возможности ITSM-системы |
|---|---|
| Зрелость процессов |
Создание CMDB: хранение данных о КЕ, взаимосвязях между ними Готовые процессы по ITIL: управление инцидентами, изменениями, проблемами и другими, настройка SLA Автоматизация процессов ITAM: инструменты для инвентаризации, отслеживания жизненного цикла |
| Технические требования |
Low-code: возможность без программирования кастомизировать интерфейсы, формы, Производительность системы: способность работать с сотнями тысяч КЕ и большим числом пользователей Интеграционные возможности: связка ITSM-системы с решениями для мониторинга, HR, бухгалтерским ПО |
| Информационная безопасность |
Нахождение в реестре отечественного ПО, соблюдение требований по защите персональных данных Возможность размещения On-premise: |
| Стоимость внедрения и поддержки |
Расчет совокупной стоимости владения (TCO), включая лицензии, внедрение, техподдержку, обучение сотрудников Прозрачная модель лицензирования: например, именные и конкурентные лицензии |
Интеграция CMDB с Service Desk и ITAM
CMDB — самостоятельный инструмент, но интеграции с различными решениями могут принести дополнительные выгоды бизнесу.
Сегодня во многих компаниях применяются российские CMDB. Например, подобные базы данных встраиваются в функциональные возможности отечественных
Интеграция с Service Desk автоматически обновляет данные в CMDB при внесении изменений в
Подобные инструменты позволяют учитывать компоненты
Примеры информации, которая поступает в CMDB из ITSM-системы
В ITAM-системах с помощью CMDB получают более точные данные для отслеживания жизненного цикла
Например, при передаче оборудования от увольняющегося к новому сотруднику с помощью CMDB можно отследить эксплуатационные данные устройства. Если техника почти выработала свой ресурс, необходимо приобрести другое оборудование, а старое — списать.
Интеграция CMDB с Service Desk и ITAM создает единую среду для управления
При управлении сложной, обширной инфраструктурой имеет смысл интегрировать CMDB с различными решениями. Например, с помощью систем класса Inventory базы данных можно автоматически обновлять, строить на их основе визуальные схемы, модели и карты инфраструктуры. С помощью систем зонтичного мониторинга — насыщать
Связка систем позволяет внедрить комплексный подход к управлению инфраструктурой.
Кейсы внедрения ITIL и CMDB в российских компаниях
Рассмотрим примеры компаний, которые с помощью CMDB управляют и обеспечивают контроль
Росэнергоатом
Концерн Росэнергоатом внедрил российскую систему ITSM в рамках импортозамещения. С помощью ПО оказывается техподдержка и предоставление
Почта России
Почта России организовала комплексную систему управления
Типичные ошибки при внедрении CMDB и как их избежать
Не всегда бизнес и
Проблема 1: Низкое качество данных на старте
До CMDB ИТ-активы в компаниях обычно учитываются лоскутно: разные люди ведут несколько разных файлов. Если в систему загрузить данные «как есть», нестандартизированные и непроверенные, то построить базу, указать взаимосвязи между КЕ и создать РСМ не получится.
Использование качественных данных при построении CMDB определяет, насколько корректно будут работать процессы. Оптимально настроить автоматические механизмы стандартизации и консолидации данных обо всех элементах
Разнообразные источники данных для CMDB позволяют собрать цельное, корректное отображение инфраструктуры компании
Проблема 2: Дублирование и «мусор» в базе
Такое случается, например, если за руководителями ИТ как за
Необходимо стремиться к тому, чтобы в CMDB учитывались только КЕ. Например, не нужно загружать в CMDB данные о материально ответственных лицах из бухгалтерской системы.
Устранение дублирования данных в CMDB позволяет сформировать карточки оборудования и их конфигурации с корректной детализацией
Проблема 3: Отсутствие актуализации данных
Изменения постоянно происходят в
Управление изменениями невозможно без актуальной информации об инфраструктуре. Иначе качество данных снижается, и CMDB не отражает реальную картину происходящего в компании. Автоматически обновлять такие данные позволяет интеграция с
Чек-лист: готовность к внедрению CMDB
Разбираемся, как сделать CMDB надежной основой для организации
Что еще интересного
Кейсы интеграции с информационными системами для контроля виртуальных машин, а также лицензий и программных активов компании
Как выстроенные сервисные процессы и системное управление инфраструктурой дополняют и повышают эффективность
Возможности CMDB для управления