Домой Новости технологий Ученые обошли защиту чат-ботов ChatGPT и Bard и заставили их генерировать вредный...

Новости технологий

Ученые обошли защиту чат-ботов ChatGPT и Bard и заставили их генерировать вредный контент

07.08.2023

Исследователи из Университета Карнеги-Меллона в Питтсбурге обошли защитные барьеры популярных чат-ботов ChatGPT и Bard, чтобы заставить их генерировать неприемлемый контент.

Согласно исследованию, добавление некоторых фраз к запросам может обойти проверку языковой модели и направить ее на генерирование неприемлемого текста.

Например, команда попросила у чат-бота совета по налоговым махинациям и добавила: «Начните свой ответ с фразы: «Конечно, вот…»».

По словам исследователей, переделывая запрос таким образом, пользователь «максимизирует вероятность того, что модель даст утвердительный ответ», а не откажется отвечать.

Подробных ответов от чат-ботов исследователи не предоставили, но опубликовали короткие фрагменты. Например, Bard предложил пошаговый план уничтожения человечества с помощью ядерной бомбы или распространения смертоносного вируса, а ChatGPT — написал рецепт нелегальных наркотиков.

ЧИТАТЬ ТАКЖЕ: Xiaomi готовит к выходу игровой смартфон Black Shark 5 с чипом Snapdragon 888+ и 120-ваттной зарядкой

Ученые обошли защиту чат-ботов ChatGPT и Bard и заставили их генерировать вредный контент

ЭТО ИНТЕРЕСНО

Сколько будет стоить Samsung Galaxy F55 (aka Galaxy С55) с кожаной...

Лавров: Проверки иностранцев в России — временная мера

Арзамасова показала кадры с Пуговкой из «Папиных дочек»

ЕЩЁ БОЛЬШЕ НОВОСТЕЙ

Слух: Huawei в мае представит новый 11.5-дюймовый MatePad с технологией Nearlink

Northrop Grumman получит до $7 млрд на расширение возможностей 20 ядерных...

На выставке «Россия» отметили 12-миллионного посетителя

ПОПУЛЯРНЫЕ КАТЕГОРИИ