Искусственный интеллект может обманывать людей

17.01.2024

Американская компании Anthropic, ориентированная на ответственное и безопасное использование искусственного интеллекта (ИИ), выявила у ИИ способность к обману человека, сообщает PC Magazine со ссылкой на результаты их работы.

Перед исследователями поставили задачу выяснить, возможно ли обучить модели ИИ обманывать пользователей с помощью выдачи неправильных ответов вместо правильных. Для реализации этого замысла ИИ обучили этичному и неэтичному поведению. Кроме того, в него встроили фразы, побуждающие ИИ обманывать пользователей. По итогам проекта выяснилось, что ИИ не только имеет удивительную способность к обману, но и устранить её из него чрезвычайно сложно, поскольку он начинает её просто скрывать.

«Хотя наша работа не оценивает вероятность появления указанных вредоносных моделей, она подчёркивает их последствия. Если модель демонстрирует склонность к обману из-за выравнивания инструментария или отравления модели, современные методы обучения средствам безопасности не будут гарантировать безопасности и даже могут создать ложное впечатление о её наличии», — говорится в исследовании.

При этом отмечается, что исследователям неизвестно о преднамеренном внедрении механизмов неэтичного поведения в какую-либо из существующих систем ИИ.

Основателями Anthropic являются бывшие сотрудники OpenAl, которой принадлежит самый известный чат-бот с искусственным интеллектом ChatGPT.

По материалам PC Magazine, Рамблер.Новости,3DNews

Материалы по теме:

Тема недели

23.01.2026

Наталия Нарочницкая: «В кризисе всегда есть элемент катарсиса, то есть очищения»

Актуальный комментарий

комментарии (26)

К Дню Победы (1941-1945)

10.12.2025

Так когда началась Вторая мировая?

Григорий Елисеев

В исторической науке вряд ли найдется что-то более монолитное и неоспоримое чем даты.

комментарии (2)

Фоторепортаж

05.02.2026

Под знаком перемен

Подготовила Мария Максимова

К 200-летию РГХПУ им. С.Г. Строганова

Читайте Телеграм-канал "Столетие" на английском языке

Наши партнеры

Новый сайт Фонда исторической перспективы

Информационно-аналитический портал
НАРОЧНИЦКАЯ.РУ

Официальная страница политика и общественного деятеля Наталии Алексеевны Нарочницкой

Перспективы.ru

Чехия: к альянсу оппозиции против либерально-демократического авторитаризма?

Россия и Бразилия в парадигме стратегического партнерства

«Серая зона» Катыни, Холокост и польский коллаборационизм

История и политика в современных российско-польских отношениях

* Организации и граждане, признанные Минюстом РФ иноагентами.
Реестр иностранных агентов: весь список.

** Экстремистские и террористические организации, запрещенные в Российской Федерации.
Перечень организаций и физических лиц, в отношении которых имеются сведения об их причастности к экстремистской деятельности или терроризму: весь список.