Событие завершено
T-Meetup: Computer Vision, 17 декабря 2024 в 16:00
Т-Банк


Встречаемся на митапе по машинному обучению: в программе — эксперты Т-Банка и Smart Engines, которые приготовили для вас три доклада о компьютерном зрении:
- обсудим текущий уровень развития VisualLM и основные инсайты по их обучению;
- рассмотрим технологии text2Image-моделей через призму задачи переноса стиля;
- узнаем, как квантовать модели для edge-устройств, сохраняя высокую точность.
Сразу после докладов — время для дискуссий и нетворкинга. Сможете пообщаться со спикерами и задать им вопросы, поближе узнать единомышленников и обсудить важные темы.
Больше новостей комьюнити — в телеграм-канале «Желтый AI».
Доклады
Методы переноса стиля в современных text2Img-моделях
За последние годы область генеративного искусственного интеллекта претерпела значительные изменения благодаря развитию text2Image-моделей, которые могут создавать реалистичные изображения на основе текстовых описаний. Я рассмотрю ключевые технологии, лежащие в основе этих моделей, и их применение в сфере переноса стиля. Обсужу с вами современные подходы к синтезу изображений, позволяющие интегрировать художественные эффекты и стилистические особенности, сферу их использования и ограничения методов.
Как делать вычислительно-эффективные нейронные сети для edge-устройств
В последние годы нейронные сети де-факто стали стандартным инструментом во всех задачах, требующих распознавания, синтеза или сложной обработки изображений на edge-системах. В таких системах есть жесткие ограничения на время исполнения и вычислительную сложность методов и объем памяти. Для решения этих проблем специалисты используют комплекс подходов, которые направлены на создание компактных квантованных нейронных сетей малых разрядностей. Я расскажу о новой разработке Smart Engines — 4,6-битных квантованных нейронных сетях, которые объединяют высокую точность и вычислительную эффективность.
Visual Language Model в 2024, какая она?
2024 год стал большим шагом в развитии VLM-моделей, которые позволяют работать с набором изображений и текстов с помощью инструкций на естественном языке. За год эксперты выпустили сотни статей об аспектах визуально-текстовой мультимодальности и десятки открытых VLM-моделей разного размера и направленности. Я проанализировал их и теперь расскажу о новых инженерных идеях и инсайтах 2024 года в построении сильной VLM, поделюсь современными VLM-приложениями и их ограничениями.
Офлайн
Бесплатно
Событие завершено
Похожие события
Архитекторы интеллекта как приручить Google AI и создать штат цифровых ассистентов за 90 минут
22 февраля 2026 в 15:00
Junior-митап «Мифы об AI в программировании: правда или ложь?»
23 февраля 2026 в 10:10
Claude Code суперсила для НЕпрограммистов
24 февраля 2026 в 19:00
Pathway что у нас нового + Q&A (и кое-что ещё)
25 февраля 2026 в 17:00
Семинар по искусственному интеллекту в г. Белорецк
26 февраля 2026 в 15:00
Игорь Ашманов открытая встреча с молодыми учёными и специалистами наукограда Троицк.
26 февраля 2026 в 19:00




