Событие завершено

M2 data meetup, 03 октября 2024 в 17:00

Name: M2 data meetup
Start: 2024-10-03T17:00:00+03:00
End: 2024-10-03T21:00:00+03:00

Аналитика Данные

3 октября в 17:00 приглашаем вас на M2 Data Meetup

На нашем первом митапе по данным мы поговорим о насущном — как строить аналитические платформы данных и как они помогают решать проблемы бизнеса.

Мы планируем пять технических докладов о разных аспектах решения задач работы с данными: от решения конкретных прикладных технических задач до вопросов построения новой платформы данных с нуля и миграции туда пользователей со старой платформы.

Офлайн-участие:

Регистрация на офлайн уже завершилась.

Онлайн-трансляция:

Если у вас нет возможности прийти на митап офлайн, подключайтесь к нашей онлайн-трансляции. Ссылка на неё будет отправлена на указанную почту накануне митапа.

Спикеры:

Павел Саликов Data Scientist Wildberries «Быстрый matching товаров на маркетплейсе Wildberries»

Какую задачу и на каких данных решаем;
От миллионов пар к тысячам: отбор кандидатов;
От тысяч пар к единицам: классификация пар;
От пар к группам: анализ графов;
Какие результаты имеем от мэтчинга.

Дмитрий Лахвич Lead Data platform M2 «Floppa the LakeHouse»

Новая платформа данных, которую строит и на которую мигрирует М2;
Trino, Dbt, Airflow;
Организация взаимодействия команд и процессы, погрузимся в технические детали;
О сложностях и вещах которые пришлось пересмотреть или отложить.

Богдан Глебов Head of Data RealX «Как мы съели ПУД соли выстраивая data management (и почти не подавились)»

Про платформу управления данными (ПУД) выстраиваемую для девелоперской компании STONE.

Даниил Понизов MLOps Wildberries «Создание MLOps-платформы для десятка команд на основе Airflow»

Настройка airflow для пользования, деплоя и запуска различными ds командами;
Мультикластерный запуск дагов;
Кастомные решения для интеграции с внутренними сервисами;
Сложности деплоя дагов;
Фичастор на базе airflow.

Павел Северилов NLP Team Lead ecom.tech (ex Samokat.tech) «Как обрабатывать, фильтровать и генерировать текстовые данные для моделей машинного обучения»

На основе опыта команды NLP из ecom.tech расскажем как работать с текстовыми данными:

Как обрабатывать текстовые данные;
Как генерировать новые текстовые данные с помощью LLM и классическими способами;
Зачем и как искать похожие данные для ML моделей.

Разберем тонкости и методы на примере задач автоматизации клиентской поддержки и аналитики обратной связи клиентов. Поделимся результатами и расскажем, какие методы помогли нам повысить качество ML моделей.

Программа митапа:

16:15 - 17:00 | Сбор гостей / Регистрация
17:05 - 17:35 | Павел Саликов «Быстрый matching товаров на маркетплейсе Wildberries»
17:35 - 18:05 | Павел Северилов «Как обрабатывать, фильтровать и генерировать текстовые данные для моделей машинного обучения»
18:05 - 18:35 | Богдан Глебов «Как мы съели ПУД соли выстраивая data management (и почти не подавились)»
18:35 - 19:05 | Даниил Понизов «Создание MLOps-платформы для десятка команд на основе Airflow»
19:05 - 19:35 | Дмитрий Лахвич «Floppa the LakeHouse»
19:45 - 21:00 | Офлайн-нетворкинг