logo

Reading Club #14 Что не так с безопасностью LLM?, 23 апреля 2025 в 18:30

event main image
event main image

Когда:5 дней до начала

Начало:Среда 23.04, 18:30 GMT+03

Конец:Среда 23.04, 20:15 GMT+03

Формат:

Онлайн

Тип:

Вебинар

Источник:

Timepad

Reading Club AI Talent Hub

Раз в две недели магистранты AI Talent Hub и эксперты из индустрии и научного мира разбирают самые актуальные статьи из мира AI в формате Reading Club.

Погружение в AI-рисерч вместе с экспертами из индустрии и научного мира.

⚡️ 23 апреля на Reading Club #14 обсудим сразу два свежих исследования о том, насколько уязвимы языковые модели и как именно их защиту удаётся обойти — даже если это GPT-4.

Исследования для обсуждения

  • Universal and Transferable Adversarial Attacks on Aligned Language Models — автоматическая генерация суффиксов, которые заставляют LLM нарушать встроенные ограничения.
    Эксперт: Никита Беляевский — инженер Raft Security, магистрант AI Talent Hub
  • AutoDAN-Turbo: A Lifelong Agent for Strategy Self-Exploration to Jailbreak LLMs — автономный агент, который сам обучается джейлбрейкам и улучшает стратегии обхода.
    Эксперт: Тимур Низамов — инженер Raft Security, магистрант AI Talent Hub

Дата и формат

Дата и время: 23 апреля (среда) в 18:30 (мск)

Формат: онлайн

Присоединяйтесь и подписывайтесь

Расскажи о мероприятии другу, который увлекается наукой!

А чтобы ничего не пропустить, подписывайся на AI Talent Hub в Telegram и YouTube!

Чтобы первым получать приглашения на полезные мероприятия AI Talent Hub — подпишись на нашу рассылку.

Онлайн

Бесплатно

Похожие события

Когда:5 дней до начала

Начало:Среда 23.04, 18:30 GMT+03

Конец:Среда 23.04, 20:15 GMT+03

Формат:

Онлайн

Тип:

Вебинар

Источник:

Timepad