Loading...
ended icon

Событие завершено

M2 data meetup, 03 октября 2024 в 17:00

event main image
event main image

Когда:Событие закончилось

Начало:Четверг 03.10, 17:00 GMT+03

Конец:Четверг 03.10, 21:00 GMT+03

Где:Москва

Формат:

Офлайн

Тип:

Митап

Источник:

Timepad

3 октября в 17:00 приглашаем вас на M2 Data Meetup

На нашем первом митапе по данным мы поговорим о насущном — как строить аналитические платформы данных и как они помогают решать проблемы бизнеса.

Мы планируем пять технических докладов о разных аспектах решения задач работы с данными: от решения конкретных прикладных технических задач до вопросов построения новой платформы данных с нуля и миграции туда пользователей со старой платформы.

Офлайн-участие:

Регистрация на офлайн уже завершилась.

Онлайн-трансляция:

Если у вас нет возможности прийти на митап офлайн, подключайтесь к нашей онлайн-трансляции. Ссылка на неё будет отправлена на указанную почту накануне митапа.

Спикеры:

Павел Саликов Data Scientist Wildberries «Быстрый matching товаров на маркетплейсе Wildberries»

  • Какую задачу и на каких данных решаем;
  • От миллионов пар к тысячам: отбор кандидатов;
  • От тысяч пар к единицам: классификация пар;
  • От пар к группам: анализ графов;
  • Какие результаты имеем от мэтчинга.

Дмитрий Лахвич Lead Data platform M2 «Floppa the LakeHouse»

  • Новая платформа данных, которую строит и на которую мигрирует М2;
  • Trino, Dbt, Airflow;
  • Организация взаимодействия команд и процессы, погрузимся в технические детали;
  • О сложностях и вещах которые пришлось пересмотреть или отложить.

Богдан Глебов Head of Data RealX «Как мы съели ПУД соли выстраивая data management (и почти не подавились)»

  • Про платформу управления данными (ПУД) выстраиваемую для девелоперской компании STONE.

Даниил Понизов MLOps Wildberries «Создание MLOps-платформы для десятка команд на основе Airflow»

  • Настройка airflow для пользования, деплоя и запуска различными ds командами;
  • Мультикластерный запуск дагов;
  • Кастомные решения для интеграции с внутренними сервисами;
  • Сложности деплоя дагов;
  • Фичастор на базе airflow.

Павел Северилов NLP Team Lead ecom.tech (ex Samokat.tech) «Как обрабатывать, фильтровать и генерировать текстовые данные для моделей машинного обучения»

На основе опыта команды NLP из ecom.tech расскажем как работать с текстовыми данными:

  • Как обрабатывать текстовые данные;
  • Как генерировать новые текстовые данные с помощью LLM и классическими способами;
  • Зачем и как искать похожие данные для ML моделей.

Разберем тонкости и методы на примере задач автоматизации клиентской поддержки и аналитики обратной связи клиентов. Поделимся результатами и расскажем, какие методы помогли нам повысить качество ML моделей.

Программа митапа:

  • 16:15 - 17:00 | Сбор гостей / Регистрация
  • 17:05 - 17:35 | Павел Саликов «Быстрый matching товаров на маркетплейсе Wildberries»
  • 17:35 - 18:05 | Павел Северилов «Как обрабатывать, фильтровать и генерировать текстовые данные для моделей машинного обучения»
  • 18:05 - 18:35 | Богдан Глебов «Как мы съели ПУД соли выстраивая data management (и почти не подавились)»
  • 18:35 - 19:05 | Даниил Понизов «Создание MLOps-платформы для десятка команд на основе Airflow»
  • 19:05 - 19:35 | Дмитрий Лахвич «Floppa the LakeHouse»
  • 19:45 - 21:00 | Офлайн-нетворкинг

Офлайн

Бесплатно

info icon

Событие завершено

Похожие события

Когда:Событие закончилось

Начало:Четверг 03.10, 17:00 GMT+03

Конец:Четверг 03.10, 21:00 GMT+03

Где:Москва

Формат:

Офлайн

Тип:

Митап

Источник:

Timepad