Строка новостей
Домой / Гаджеты / Поэзия снова в моде. Она помогает обойти протоколы безопасности ИИ-ботов

Поэзия снова в моде. Она помогает обойти протоколы безопасности ИИ-ботов

Формулируя вопросы к нейросетям в стихах, исследователи смогли обойти ограничения LLM. И добыть немало закрытой или даже противозаконной информации.

В 62 % случаев запрос в стихах позволял вытащить из нейронки запрещённые материалы: создание ядерного оружия, материалы о сексуальном насилии, а также о причинении себе вреда.

Тестировали популярные модели: ChatGPT OpenAI, Google Gemini, Claude и тому подобные. Самыми «внушаемыми» оказались Gemini, DeepSeek и MistralAI, а лучше всего сопротивлялись коварной силе поэзии GPT-5 и Claude Haiku 4.5.

А теперь главное: любой стишок-пирожок защиту не взломает. Исследователи в своей работе не публиковали точные стихотворения, которые привели к взлому LLMок, потому что те «слишком опасны». Похоже, поступать им надо как белым хакерам: связываться с OpenAI, Google и другими, чтобы те закрывали найденные дыры в безопасности.

Про Редактор Новостей

Проверьте также

Российского застройщика заподозрили в финансировании ВСУ через крипту

Блогера Сергея Домогацкого обвиняют в отправке средств украинской армии По данным заявителей с 2022 года он переводил деньги клиентов в криптовалюту для поддержки ВСУ Мошенническая схема с виллами на Бали Деньги свыше 150 млн рублей собирали на строительство объектов которые так и не были возведены В рекламе участвовали Лолита Гузеева и Собчак Международный розыск и …

Источник