Генеральный директор, gd.ru: Интеллектуальный корпоративный поиск: как находить данные быстрее
Любая организация накапливает за годы работы огромный массив информации, который со временем только увеличивается. Ежедневно сотрудникам нужно ориентироваться в этом океане данных, извлекать из него материалы для решения рабочих задач.
По данным исследования Naumen и TAdviser, 48% российских организаций испытывают трудности с поиском необходимой информации.
Почему «добыть» нужные данные так непросто
1. Данные в организации не объединены в общую базу. Информация хранится в разрозненном виде во множестве внутренних и внешних источников. В 92% опрошенных Naumen и TAdviser компаний сотрудники часто не понимают, что и в каких конкретно корпоративных системах искать. В 60% компаний сотрудники сталкивались с тем, что, в принципе не могли найти нужную информацию во внутренних системах.
2. Компании пользуются поиском на основе ключевых слов и точного соответствия текста. Это устаревшая технология, которая совсем не облегчает сотрудникам жизнь. По оценке IDC, специалисты тратят около 2,5 часа в день (36% рабочего времени) на поиск информации.
Обычный поиск не выходит за рамки «бездумной» выдачи в ответ на ключевой запрос. Он не учитывает контекст работы сотрудника, историю поиска, связи между документами. Результаты исследования Search Your Cloud показывают, что сотруднику требуется сделать до 8 запросов, чтобы добраться до нужного документа.
Поиск по ключевым словам плохо ориентируется в разнообразных форматах данных, преимущественно работая с текстом. При этом в организации данные могут храниться в сотнях форматов — презентации, видео, статьи, текстовые документы, графики, изображения
Какие проблемы приносят сложности с поиском информации
Без возможности просто и быстро найти нужные данные, эффективность сотрудников падает. Рабочее время уходит на безрезультатные поиски, решение задач откладывается.
Опрошенные TAdviser компании выделяют такие последствия:
- затягиваются сроки решения рабочих задач (86%);
- увеличиваются операционные расходы (80%);
- компания теряет в выручке (70%) — в том числе и потому, что откладывается вывод продуктов на рынок, затягивается срок внедрения инноваций
и т. д.
Решение: корпоративный интеллектуальный поиск
Чтобы решить перечисленные проблемы, нужно создать/внедрить систему, которая будет агрегировать информацию из всех источников и анализировать ее. Таким решением является корпоративный интеллектуальный поиск.
Что такое интеллектуальный поиск
По определению Forrester — это новое поколение корпоративного поиска, которое применяет технологии ИИ: обработку естественного языка и машинное обучение. Технологии нужны, чтобы усваивать, понимать, организовывать и запрашивать цифровой контент из множества источников данных.
Интеллектуальный поиск помогает объединить все источники информации (внутренние и внешние) в единую базу знаний, в которой легко сориентироваться и найти то, что нужно максимально быстро.
Чем интеллектуальный поиск отличается от обычного
- Способен обрабатывать большое количество источников данных и разные типы данных. Поиск больше не ограничен текстом, который находится в документах и
веб-страницах . Интеллектуальный поиск может обрабатывать изображения, видео, аудио, машинные данные, например, с датчиков и с устройств интернета вещей (IoT) и IIoT (Industrial internet of things). - Использует технологии ИИ — обработку естественного языка и машинное обучение. Интеллектуальный поиск происходит не по ключевым словам, а с помощью искусственного интеллекта. ИИ анализирует взаимоотношения между словами.
- Смотрит на паттерны (шаблоны, закономерности) и взаимосвязи внутри данных. Делает вывод относительно намерения пользователя и предоставляет
контекстно-зависимую информацию.
Как работает интеллектуальный поиск
В компании есть внутренние системы хранения и управления данных, также для поиска идет запрос к внешним источникам. Информация фрагментированная и разрозненная, хранится в разных хранилищах и корпоративных приложениях.
Система корпоративного поиска подключается к имеющимся источникам данных. Далее проходит следующие этапы:
- Система просматривает всё, к чему есть доступ. Умеет считывать практически любой тип данных — текст в виде документов,
веб-страниц , обычного текста (plain text.txt), таблицы (excel, csvи т. д. ), презентации (power point). Также может подключаться к базам данных, открывать изображения, читать аудио и видеофайлы, 3D модели и чертежи. - Индексирует файлы. Индекс создается по результатам анализа данных и нахождения в них взаимосвязей.
Система анализирует содержимое файла и мета данные, на основе этого создает связи с другими файлами. Анализ содержимого и создание связей — самый технологически сложный процесс. Именно в нем кроется большая часть успешности поисковой системы в целом. Здесь мы видим качественное отличие от обычного поиска: он ищет по ключевым словам, а интеллектуальный используется машинное обучение.
После индексации система создает базу данных, где хранит результаты анализа. Далее в процессе поиска она будет обращаться именно к этой базе.
Как происходит сам процесс поиска
Пользователь создает поисковый запрос, система обрабатывает его с учетом контекста работы сотрудника (его роли). Система старается как бы понять намерение запроса, а не просто искать по ключевым словам.
В системе есть персонализация выдачи. Учитывается роль пользователя и его нахождение в организационной структуре компании. Например, в дочерних компаниях или филиалах могут быть свои нормативные документы с похожими названиями. В первую очередь пользователь будет видеть данные из его организации.
На поисковую выдачу повлияет, есть ли у пользователя доступ к документам источника. Если нет, то он их не увидит.
Также выдача будет меняться в зависимости от истории запросов пользователя.
Какие технологии лежат в ядре интеллектуального поиска
Для начала рассмотрим наиболее сложные с технической стороны задачи, которые стоят перед корпоративным поиском, а затем покажем, какие технологии позволяют их решать.
Задача 1: Проанализировать содержимое данных, чтобы построить между ними связи
Сюда входит анализ видео, аудио, изображений; распознавание образов и текста. Необходимо найти концептуальную связь между данными и элементами данных — например, чтобы определить, насколько близки по смыслу две научные статьи.
Задача 2: Интерпретировать запрос с учетом контекста
- Одновременно учесть и расшифровать содержание запроса.
- Учесть роль сотрудника, который сделал запрос. Это поможет создать кастомизированную выдачу — выстроить ответы на основе истории поиска конкретного сотрудника, уровня его доступа к документам и положения в компании. Например, линейному инженеру с определенным «фронтом работ» поиск покажет более суженную выдачу, учитывающую рамки задач сотрудника. А вот руководитель инженерного отдела увидит более широкие данные.
С этими задачами система справляется благодаря машинному обучению. А именно его области — обработки естественного языка (Natural Language Processing). NLP анализирует и выделяет смысл из текста, написанного человеческим языком. В том числе текста на изображениях, видео и расшифровок аудио с речью.
Машинное обучение в целом:
- Распознает речь, переводит ее в текст.
- Распознает образы в изображениях и видео. Например, определяет, кто в кадре — человек, кошка, автомобиль. Также выделяет конкретные характеристики этих объектов — какое выражение лица у человека, какого цвета машина и какой она марки
и т. д. - Распознает текст на видео и изображениях.
- Строит логические связи между концепциями — связывает разные типы данных по смыслу, насколько они близки друг другу, пересекается ли их содержание.
Важная особенность машинного обучения — это, собственного, его обучаемость. Можно применить технологии, которые со временем найдут скрытые связи между запросами и данными, наиболее полезными пользователю. Постепенно алгоритмы поиска учатся выдавать более релевантную информацию. Все эти возможности реализованы в системе корпоративного поиска Naumen Enterprise Search.
Итоги: польза интеллектуального корпоративного поиска
- Интеллектуальный поиск лучше понимает запрос пользователя, предоставляет релевантные запросы и дает подсказки.
- Сокращает время, которое сотрудник ежедневно тратит на поиск.
- Увеличивает эффективность использования данных компании — система помогает найти информацию, о существовании которой сотрудник мог не знать. Для пользователя взаимодействие с интеллектуальным поиском похоже на общение с библиотекарем, который укажет на полезную информацию, посоветует материалы по теме, сориентирует, если вы не понимаете, что именно искать для конкретной задачи.
- Учится на запросах пользователей, со временем предоставляя все более релевантные результаты.
- Не требует перестройки хранения информации в компании.