Дмитрий Стефановский
Интерактивный data mining: возможности Orange — продукта с открытым исходным кодом
О чем
Об основах интерактивного data mining рассказал Дмитрий Стефановский, директор «Центра компетенций по цифровой прослеживаемости и консалтингу» РАНХиГС, кандидат технических наук, специалист в области прикладных исследований по цифровой трансформации.
Заметка
Видео
Презентация

Артур Фёдоров
Семантический анализ текста в неевклидовой геометрии
О чем
Специалист по машинному анализу естественного языка в группе операционного моделирования Yandex.Market Артур Фёдоров рассказал о модели Пуанкаре — гиперболического пространства для текстового анализа, которая сохраняет скрытую иерархическую структуру текста. Эксперт сравнил стандартные методы нахождения векторных представлений текстов с методом, основанным на неевклидовых геометриях, и показал, как решение таких задач, как машинный перевод или анализ тональности текстов, становится более точным, если сохраняется контекстное значение омонимов.
Заметка
Видео
Код
Презентация
Сергей Бершадский
Имеет ли робот те же права на информацию, что и человек?
О чем
Сергей Бершадский, backend-разработчик и в прошлом системный архитектор таких проектов, как медицинский портал ЕМИАС.инфо, Play2Live, toptal и др., рассказал об опыте веб-скрейпинга с использованием библиотек Python Scrapy, Beautiful Soup, Asyncio.
Заметка
Видео
Презентация
Сергей Ананян
Как извлекать полезную информацию из текста – система PolyAnalyst
О чем
Генеральный директор компании Мегапьютер Сергей Ананян рассказал об извлечении информации из текстовых документов и представил подход, основанный на использовании специального языка запросов и результатах углубленного лингвистического и семантического анализа текста. Эксперт показал, как работает аналитическая система PolyAnalyst™.
Видео: скоро
Презентация: скоро