Событие завершено
M2 data meetup, 03 октября 2024 в 17:00


3 октября в 17:00 приглашаем вас на M2 Data Meetup
На нашем первом митапе по данным мы поговорим о насущном — как строить аналитические платформы данных и как они помогают решать проблемы бизнеса.
Мы планируем пять технических докладов о разных аспектах решения задач работы с данными: от решения конкретных прикладных технических задач до вопросов построения новой платформы данных с нуля и миграции туда пользователей со старой платформы.
Офлайн-участие:
Регистрация на офлайн уже завершилась.
Онлайн-трансляция:
Если у вас нет возможности прийти на митап офлайн, подключайтесь к нашей онлайн-трансляции. Ссылка на неё будет отправлена на указанную почту накануне митапа.
Спикеры:
Павел Саликов Data Scientist Wildberries «Быстрый matching товаров на маркетплейсе Wildberries»
- Какую задачу и на каких данных решаем;
- От миллионов пар к тысячам: отбор кандидатов;
- От тысяч пар к единицам: классификация пар;
- От пар к группам: анализ графов;
- Какие результаты имеем от мэтчинга.
Дмитрий Лахвич Lead Data platform M2 «Floppa the LakeHouse»
- Новая платформа данных, которую строит и на которую мигрирует М2;
- Trino, Dbt, Airflow;
- Организация взаимодействия команд и процессы, погрузимся в технические детали;
- О сложностях и вещах которые пришлось пересмотреть или отложить.
Богдан Глебов Head of Data RealX «Как мы съели ПУД соли выстраивая data management (и почти не подавились)»
- Про платформу управления данными (ПУД) выстраиваемую для девелоперской компании STONE.
Даниил Понизов MLOps Wildberries «Создание MLOps-платформы для десятка команд на основе Airflow»
- Настройка airflow для пользования, деплоя и запуска различными ds командами;
- Мультикластерный запуск дагов;
- Кастомные решения для интеграции с внутренними сервисами;
- Сложности деплоя дагов;
- Фичастор на базе airflow.
Павел Северилов NLP Team Lead ecom.tech (ex Samokat.tech) «Как обрабатывать, фильтровать и генерировать текстовые данные для моделей машинного обучения»
На основе опыта команды NLP из ecom.tech расскажем как работать с текстовыми данными:
- Как обрабатывать текстовые данные;
- Как генерировать новые текстовые данные с помощью LLM и классическими способами;
- Зачем и как искать похожие данные для ML моделей.
Разберем тонкости и методы на примере задач автоматизации клиентской поддержки и аналитики обратной связи клиентов. Поделимся результатами и расскажем, какие методы помогли нам повысить качество ML моделей.
Программа митапа:
- 16:15 - 17:00 | Сбор гостей / Регистрация
- 17:05 - 17:35 | Павел Саликов «Быстрый matching товаров на маркетплейсе Wildberries»
- 17:35 - 18:05 | Павел Северилов «Как обрабатывать, фильтровать и генерировать текстовые данные для моделей машинного обучения»
- 18:05 - 18:35 | Богдан Глебов «Как мы съели ПУД соли выстраивая data management (и почти не подавились)»
- 18:35 - 19:05 | Даниил Понизов «Создание MLOps-платформы для десятка команд на основе Airflow»
- 19:05 - 19:35 | Дмитрий Лахвич «Floppa the LakeHouse»
- 19:45 - 21:00 | Офлайн-нетворкинг
Офлайн
Бесплатно
Событие завершено
Похожие события
Отчёты по качественным исследованиям (не UX)
24 февраля 2026 в 18:30
Accessibility роль аналитика в обеспечении доступности приложений
26 февраля 2026 в 18:30
It-завтрак х tltgames 28 февраля
28 февраля 2026 в 11:00
Желтый клуб Питер - Март 2026
12 марта 2026 в 19:00
KozhinDev Meetup Веб-разработка
19 марта 2026 в 19:00
Количественные исследования для не_количественников
24 марта 2026 в 18:30



