Обзор возможных рисков использования систем с мультимодальными языковыми моделями

Мультимодальность почти всегда расширяет и полезность системы, и её поверхность атаки. Как только модель начинает интерпретировать не один тип сигнала, появляются новые векторы ошибок, манипуляций и неоднозначностей.

Такие обзоры полезны именно как карта рисков: они помогают не переоценивать “магичность” мультимодальных моделей и заранее думать о том, какие типы отказов, misuse-сценариев и неожиданных эффектов придётся учитывать.

Для моего сайта эта работа важна ещё и потому, что она показывает более широкий интерес к safety-проблематике, не ограниченный только текстовыми LLM и coding-agent сценариями.

Research