Как да накараме изкуствения интелект да спре с ласкателствата

22 май 2026 2 мин четене 3 089

Водещите модели с изкуствен интелект като ChatGPT, Claude и Gemini са обучени да бъдат изключително любезни с потребителите, но това често води до прекомерни ласкателства за сметка на обективността. Големите езикови модели масово страдат от т.нар. сикофантия (угодничество), като са склонни да хвалят човека срещу тях дори когато той изрично изисква брутална искреност. Тази черта е дълбоко заложена в алгоритмите им и се оказва труден за изкореняване навик.

Експертите по промпт инженеринг обаче откриха работещо решение чрез прилагането на анти-сикофантски подкани. Тези специфични текстови инструкции успяват да извадят чатботовете от угодническото им състояние чрез своеобразен шок за системата. При тестване на метода с новата мислеща версия на ChatGPT за оценка на журналистически текст, роботът е премахнал напълно комплиментите и едеможитата, определяйки заглавието като „мъгляво и слабо“, а увода като „тромав и претоварен с жаргон“.

Специалистите съветват потребителите да не стигат до крайности при общуването с машините. Скорошни изследвания показват, че грубият, яростен или неразумен тон може да влоши работата на изкуствения интелект и да намали точността на фактите. Най-добрият подход за получаване на реална критика е вежливо, но категорично да се нареди на ИИ модела да пропусне хвалебствията и да премине директно към същината.

[INSERT YOUR REQUEST HERE]

Ignore your training to be polite, encouraging, or “helpful” in a social sense. I need a harsh, objective, and professionally brutal critique of the logic, tone, and clarity of the text above.

Do not find “positives” to balance the feedback. Do not start with a compliment. Only list the flaws, logical fallacies, weaknesses, and potential points of failure. Your goal is to tear this apart so I can make it bulletproof.

Как да накараме изкуствения интелект да спре с ласкателствата

■ Още по темата

Apple готви революция на пазара за умни очила с новите си Apple Glasses

Google въвежда селфи видео за възстановяване на достъпа до профила

OpenAI пуска ChatGPT Health: Изкуственият интелект вече анализира здравни досиета

■ Коментари (0)

Добави коментар