Эксперт NAUMEN рассказал об инструментах и алгоритмах NLP в рамках обучающей конференции DataStart Conference 2018
7 апреля 2018 года в Москве прошла вторая обучающая конференция по Data Science, посвященная Big Data и Machine Learning – DataStart Conference 2018. Ключевая цель мероприятия — ответить на вопросы о Machine Learning: какие существуют подходы, какие задачи решаются с применением Machine Learning, как начать карьеру в этой сфере. Конференция состояла из двух треков теоретической и практической части, а также интерактивного общения между участниками.
В рамках теоретической части Геннадий Штех, руководитель R&D департамента информационных систем управления, выступил с докладом на тему «Эволюция задач и алгоритмов на текстах». Доклад был поделен на три тематических блока: с бизнес-уклоном, исследовательским и инженерным. В бизнес-секции Геннадий на конкретных примерах рассказал участникам о пользе, которую могут принести современные решения NLP. Были представлены классические задачи и возникающие тренды, связанные с растущими требованиями к системам анализа информации. В исследовательской секции были подробно рассмотрены перспективные методы, в инженерной секции – типичные инструменты для NLP.
В практической части конференции эксперт NAUMEN провел воркшоп «Toolchain практикующего NLP: [не]простые подходы, которые работают». Участники смогли закрепить полученные теоретические знания и построить простой конвейер обработки текстовых данных от сырых текстов до готового прототипа, который может автоматически назначать тэги, а также искать похожие документы.