Публикации

В пресс-центр

Облака, нейросети и управление данными

Какое будущее ждет российский LegalTech.

Oblaka-nejroseti-i-upravlenie-dannymi-kakoe-budushhee-zhdet-rossijskij-LegalTech-1068x712.png

Руководитель направления интеллектуального анализа и поиска данных компании NAUMEN, эксперт международной образовательной конференции Distant & Digital Кира Есаулова — о главных трендах автоматизации и путях развития юридических технологий.

В мире наметилось четыре основных тренда в области автоматизации бизнеса, которые в полной мере проявляются и в России. Самый очевидный — интеллектуализация, то есть включение технологий искусственного интеллекта (ИИ) в информационные системы. С одной стороны, это инженерия ИИ, а с другой — внедрение отдельных элементов ИИ в рутинные операции: чат-боты, голосовые помощники, специфические интеллектуальные сервисы. Второй тренд связан с переходом к сервисной модели обслуживания, то есть последовательному упрощению операций: крупные блоки внутри бизнес-процесса намеренно дробятся на сервисы меньше и легче. Третий тренд — организации стремятся перенести вычисления и сервисы в облачные платформы. Пандемия, переход к удаленному режиму работы и распределению команд существенно усилили эту тенденцию. Наконец, важное направление связано с развитием платформ управления данными, которые интегрируют информацию компании и содержат инструменты ИИ для эффективного управления этими сведениями.

В России к обозначенным тенденциям добавляется тренд на импортозамещение в сфере разработки ПО, а также на максимальную цифровизацию процессов, в том числе с применением ИИ. Отличительная особенность нашей страны — в роли, которую государство играет в процессе цифровой трансформации. Собственно, в этом ключевое преимущество российского рынка автоматизации: государство покровительствует ему в рамках курса на импортозамещение и цифровую трансформацию крупных организаций.

Участие государства накладывает отпечаток на все рыночные процессы. Так, особенность взаимодействия с государственными заказчиками — более длительный цикл принятия решений, предварительное согласование условий контракта на покупку ПО. В отличие от частных компаний, как правило, настроенных на оптимизацию конкретных участков работы, государственным организациям и компаниям с госучастием больше интересны крупные проекты, позволяющие оптимизировать сквозные процессы, что, как правило, соответствует принятым стратегиям цифровой трансформации.

Еще одно преимущество российского рынка — традиционно сильные специалисты в сфере ИТ, в том числе в направлениях математической статистики, компьютерной лингвистики, технологий машинного обучения. Стимул к развитию рынка дает и тот очевидный факт, что решения, ориентированные на англоязычные тексты, слабо применимы для решения прикладных задач в России.

Характерный пример отрасли, неразрывно связанной с семантикой и языком, — юриспруденция. Во многом поэтому LegalTech, будучи весьма перспективным направлением, пока не демонстрирует такого взрывного роста, как финтех. Юртех сталкивается с ограничениями: тексты труднее обрабатывать, чем цифры, — для этого требуются специальные технологии, позволяющие учитывать семантику. К тому же юридическим процессам свойственна крайняя чувствительность к ошибкам. Отсюда, алгоритмы обработки текстовых документов должны быть максимально нацелены на сохранение смысла.

Необходимость учитывать особенности русского языка, российского законодательства и правовой системы стимулирует производство новых решений. Так, наш основной продукт для автоматизации юридических процессов — Naumen LegalTech (на платформе Naumen SemanticTech) — позволяет работать с архивом документов. Там есть удобный и точный поиск информации из различных источников, каталогизация, анализ взаимосвязей документов, сервисы проверки договоров, аннотирования документов. Кроме того, решение обеспечивает поддержку процесса нормотворческой деятельности, в том числе мониторинг изменений и сервисы-помощники для разработки нормативно-правовых актов. Примечательно, что эти инструменты разрабатывались для юристов, но полезны любым специалистам, работающим с большим потоком документов.

Доброжелательное внимание государства, отсутствие избыточного регулирования, высококлассные специалисты — все это создает благоприятные предпосылки для развития LegalTech в России. Однако есть и очевидные барьеры. Так, использование ИИ ставит проблему семантики. Юристам необходимо получать от систем объяснимые решения. Согласно текущему законодательству машина (ИИ) не субъект права и ответственность за принятие решений в юридической сфере все еще лежит на человеке. Поэтому необходимо обеспечить доверие пользователя к выводам и рекомендациям машины (системы). В частности, от алгоритмов требуется сохранение семантики — например, при составлении аннотаций больших документов, при анализе договоров на предмет выявления рисков.

Сегодня технологические гиганты, такие как Google, Яндекс, Nvidia, создают языковые модели, которые претендуют на «понимание» естественного языка. Но, во-первых, такие модели не учитывают специфику предметной области, а юридический язык отличается от языка новостей или художественных текстов. Во-вторых, такие гигантские модели слишком дороги в обучении. Не у каждого бизнеса, будь то заказчик или разработчик ПО, есть такие вычислительные ресурсы: суперкомпьютеры и время в несколько недель или даже месяцев, чтобы дообучать модель, а также достаточный объем данных, которые можно «скормить» программе. Поэтому путь повышения точности за счет усложнения нейросетей можно считать тупиковым, и нужно смотреть в сторону упрощения, что также приведет и к большей объяснимости решений.

Кроме того, для решения многих прикладных задач требуется переход к машиночитаемому праву, что включает в себя создание онтологий и графов знаний юридической отрасли. В 2021 году правительственная комиссия по цифровому развитию под руководством зампреда правительства Дмитрия Чернышенко утвердила разработанную Минэкономразвития России Концепцию развития технологий машиночитаемого права. Однако мы только в начале этого пути: сегодня большинство юридических текстов слабо структурированы, правовые онтологии еще только разрабатываются отдельными группами исследователей.

Отдельно можно отметить экономические барьеры, такие как низкий уровень венчурных инвестиций и отсроченный экономический эффект инноваций в LegalTech и RegTech.

7 февраля руководитель направления интеллектуального анализа и поиска данных компании NAUMEN Кира Есаулова выступит модератором сессии «Практика регулирования нормотворческой деятельности в банках и органах государственной власти» на международной образовательной конференции Distant & Digital.

Кира Есаулова
The Paragraph Magazine

Ссылка на источник