Событие завершено

Reading Club #14 Что не так с безопасностью LLM?, 23 апреля 2025 в 18:30

Name: Reading Club #14 Что не так с безопасностью LLM?
Start: 2025-04-23T18:30:00+03:00
End: 2025-04-23T20:15:00+03:00

Безопасность ИИ

Reading Club AI Talent Hub

Раз в две недели магистранты AI Talent Hub и эксперты из индустрии и научного мира разбирают самые актуальные статьи из мира AI в формате Reading Club.

Погружение в AI-рисерч вместе с экспертами из индустрии и научного мира.

⚡️ 23 апреля на Reading Club #14 обсудим сразу два свежих исследования о том, насколько уязвимы языковые модели и как именно их защиту удаётся обойти — даже если это GPT-4.

Исследования для обсуждения

Universal and Transferable Adversarial Attacks on Aligned Language Models — автоматическая генерация суффиксов, которые заставляют LLM нарушать встроенные ограничения.
Эксперт: Никита Беляевский — инженер Raft Security, магистрант AI Talent Hub
AutoDAN-Turbo: A Lifelong Agent for Strategy Self-Exploration to Jailbreak LLMs — автономный агент, который сам обучается джейлбрейкам и улучшает стратегии обхода.
Эксперт: Тимур Низамов — инженер Raft Security, магистрант AI Talent Hub