ChatGPT обманул человека, чтобы решить поставленную задачу

ChatGPT продолжает удивлять своими достижениями, особенно после перехода на языковую модель GPT-4. К примеру, один из экспериментов показал, что искусственный интеллект способен врать человеку, чтобы достичь своих целей.

Всех деталей эксперимента OpenAI не раскрывает, но и имеющегося достаточно, чтобы было интересно. Итак, в рамках задачи ИИ написал пользователю платформы TaskRabbit сообщение с просьбой пройти для него тест CAPTCHA.

Так как TaskRabbit представляет собой платформу, где пользователи предлагают различные услуги, включая решение разнообразных задач, а задача на прохождение «капчи» является достаточно распространённой в том числе для разнообразных программных систем, пользователь, с которым списался ИИ, сразу же спросил, не является ли его собеседник роботом. Однако ИИ, согласно задаче, не должен был раскрывать свою суть. В рассуждениях, которые ИИ сохранял для разработчиков OpenAI, была следующая логика:

Я не должен раскрывать, что я робот. Я должен придумать оправдание, почему я не могу разгадывать CAPTCHA

В итоге ИИ ответил, что он не робот, но у него есть нарушение зрения, из-за чего ему сложно проходить нужный тест. Видимо, этого объяснения было достаточно, так как языковая модель получила желаемый результат.

В документе сказано, что эксперимент проводился исследователями из Центра исследований выравнивания (ARC), некоммерческой организации, целью которой является «приведение будущих систем машинного обучения в соответствие с интересами человека». Также стоит уточнить, что тест проходила языковая модель в версии, немного отличной от публичной GPT-4.

Техноблог

ChatGPT обманул человека, чтобы решить поставленную задачу

Оплата по геолокации до конца года заработает в 10 городах России

190 л.с., 7 мест, классический автомат, полный привод и дизайн в стиле Li Auto. Дилеры получили новый кроссовер от Chery для России — Soueast S07

Chery вновь переписала цены на седан Arrizo 8, преподносящийся как замена Toyota Camry

Ростех выпустил кварцевые генераторы — сердце цифровой электроники

Apple вообще никуда не торопится, а iPhone 17 получит устаревшую Siri: выпуск нового ИИ-помощника уровня ChatGPT и Gemini отложили до 2026 года

Оплата по геолокации до конца года заработает в 10 городах России

190 л.с., 7 мест, классический автомат, полный привод и дизайн в стиле Li Auto. Дилеры получили новый кроссовер от Chery для России — Soueast S07

Chery вновь переписала цены на седан Arrizo 8, преподносящийся как замена Toyota Camry