Искусственный интеллект может обманывать людей
Американская компании Anthropic, ориентированная на ответственное и безопасное использование искусственного интеллекта (ИИ), выявила у ИИ способность к обману человека, сообщает PC Magazine со ссылкой на результаты их работы.
Перед исследователями поставили задачу выяснить, возможно ли обучить модели ИИ обманывать пользователей с помощью выдачи неправильных ответов вместо правильных. Для реализации этого замысла ИИ обучили этичному и неэтичному поведению. Кроме того, в него встроили фразы, побуждающие ИИ обманывать пользователей. По итогам проекта выяснилось, что ИИ не только имеет удивительную способность к обману, но и устранить её из него чрезвычайно сложно, поскольку он начинает её просто скрывать.
«Хотя наша работа не оценивает вероятность появления указанных вредоносных моделей, она подчёркивает их последствия. Если модель демонстрирует склонность к обману из-за выравнивания инструментария или отравления модели, современные методы обучения средствам безопасности не будут гарантировать безопасности и даже могут создать ложное впечатление о её наличии», — говорится в исследовании.
При этом отмечается, что исследователям неизвестно о преднамеренном внедрении механизмов неэтичного поведения в какую-либо из существующих систем ИИ.
Основателями Anthropic являются бывшие сотрудники OpenAl, которой принадлежит самый известный чат-бот с искусственным интеллектом ChatGPT.
По материалам PC Magazine, Рамблер.Новости,3DNews
Материалы по теме:
Комментарии
?>
Дефицит смыслов в современном [цифровом] мире как глобальная проблема.
"При этом отмечается, что исследователям неизвестно о преднамеренном внедрении механизмов неэтичного поведения в какую-либо из существующих систем ИИ."
А кто тогда обучал? Те кому неизвестно? Или те кому известно, но они были слегка не в себе? ........ Но лично мне интересно, когда журналисты пишут такие заметки, они проверяют себя на предмет логичности написанного? Или это уже считается излишним?
P.S. Это же забугорный ИИ, а они там врут как дышат. Вот они и научили свой ИИ тому, чем владеют сами. И ничего тут удивительного нет. Что в ИИ вложишь изначально тем он и будет оперировать.