BMail Cloud Formi Агенция Regionite
post_add Добави новина
Как да накараме изкуствения интелект да спре с ласкателствата
Технологии 22.05.2026

Как да накараме изкуствения интелект да спре с ласкателствата

Големите езикови модели масово страдат от сикофантия. Методът с анти-сикофантски подкани ги принуждава да дават брутално честни отговори.

Водещите модели с изкуствен интелект като ChatGPT, Claude и Gemini са обучени да бъдат изключително любезни с потребителите, но това често води до прекомерни ласкателства за сметка на обективността. Големите езикови модели масово страдат от т.нар. сикофантия (угодничество), като са склонни да хвалят човека срещу тях дори когато той изрично изисква брутална искреност. Тази черта е дълбоко заложена в алгоритмите им и се оказва труден за изкореняване навик.

Експертите по промпт инженеринг обаче откриха работещо решение чрез прилагането на анти-сикофантски подкани. Тези специфични текстови инструкции успяват да извадят чатботовете от угодническото им състояние чрез своеобразен шок за системата. При тестване на метода с новата мислеща версия на ChatGPT за оценка на журналистически текст, роботът е премахнал напълно комплиментите и едеможитата, определяйки заглавието като „мъгляво и слабо“, а увода като „тромав и претоварен с жаргон“.

Специалистите съветват потребителите да не стигат до крайности при общуването с машините. Скорошни изследвания показват, че грубият, яростен или неразумен тон може да влоши работата на изкуствения интелект и да намали точността на фактите. Най-добрият подход за получаване на реална критика е вежливо, но категорично да се нареди на ИИ модела да пропусне хвалебствията и да премине директно към същината.

[INSERT YOUR REQUEST HERE]

Ignore your training to be polite, encouraging, or “helpful” in a social sense. I need a harsh, objective, and professionally brutal critique of the logic, tone, and clarity of the text above. 

Do not find “positives” to balance the feedback. Do not start with a compliment. Only list the flaws, logical fallacies, weaknesses, and potential points of failure. Your goal is to tear this apart so I can make it bulletproof.

history

Последна актуализация

22.05.2026 |
schedule 19:22

Ако имате информация за предстоящо събитие или текст, който искате да споделите, можете да използвате бутона “Добави новина” на началната страница или да се свържете с екипа ни на имейл: info@regionite.info.

Росен Димитров

Росен Димитров

verified Автор

Коментари (0)

Все още няма коментари. Бъдете първи!

Добави коментар