post_add Добави новина
Изкуственият интелект на OpenAI триумфира в шахматен турнир
Любопитно 08.08.2025

Изкуственият интелект на OpenAI триумфира в шахматен турнир

Моделът o3 на OpenAI побеждава Grok 4 в напрегнат финал

Моделът o3 на компанията OpenAI, създателите на ChatGPT, спечели шахматен турнир за изкуствен интелект, като победи Grok 4 на xAI в изключително напрегнат финал. Състезанието, организирано на платформата Kaggle, събра водещи езикови модели, предназначени за ежедневна употреба, а не специализирани шахматни програми. Тази победа на OpenAI засилва конкуренцията между технологичните гиганти, като Илон Мъск и Сам Алтман, съоснователи на OpenAI, продължават да спорят чии модели са най-интелигентни.

Турнирът, проведен между 5 и 7 август 2025 г., включи осем водещи езикови модела от компании като Anthropic, Google, OpenAI, xAI, DeepSeek и Moonshot AI. Моделът o3 остана непобеден, като на финала разгроми Grok 4 с убедителния резултат 4:0. Моделът Gemini 2.5 Pro на Google зае трето място, надделявайки над друг модел на OpenAI – o4-mini.

Въпреки силното представяне на Grok 4 до полуфиналите, той допусна серия от груби грешки, включително многократно губене на царицата си, което позволи на o3 да доминира. „До полуфиналите Grok изглеждаше непобедим, но в последния ден илюзията се разпадна“, коментира Педро Пинхата от Chess.com. Шахматният гросмайстор Хикару Накамура добави: „Grok направи много грешки, докато OpenAI ги избегна“.

Илон Мъск сподели в платформата X, че успехът на Grok 4 е „страничен ефект“, тъй като xAI „почти не е инвестирала усилия в шах“. Той подчерта, че силата на модела идва от чисто стратегическо мислене, а не от специализирана подготовка.

Значението на шаха за изкуствения интелект

Шахът и други стратегически игри като Го се използват като бенчмарк за оценка на способностите на AI в логическо мислене и вземане на оптимални решения. Турнирът на Kaggle, подкрепен от Google DeepMind, Chess.com и шахматни звезди като Хикару Накамура и Магнус Карлсен, предостави уникална възможност за анализ на стратегическите способности на универсалните AI модели. За разлика от специализирани програми като Stockfish или AlphaZero, тези модели разчитат единствено на собствените си механизми за разсъждение, без достъп до външни шахматни двигатели.

Исторически шахът е бил ключова арена за тестване на компютърни възможности. През 1997 г. Гари Каспаров загуби от суперкомпютъра Deep Blue на IBM, а през 2019 г. южнокорейският майстор на Го Ли Се-дол се оттегли след поражения от AlphaGo на DeepMind, заявявайки, че „има същество, което не може да бъде победено“.

Какво разкриват резултатите от турнира?

Резултатите от състезанието показват, че макар универсалните AI модели да са впечатляващи в ежедневни задачи, те все още имат ограничения в сложни стратегически игри. Grok 4 демонстрира силна игра в началото, но слабостите му в тактическото планиране станаха очевидни на финала. От друга страна, o3 показа по-добра последователност и избягване на грешки, което му осигури победата.

Турнирът подчертава потенциала на AI за абстрактно мислене, но също и необходимостта от подобрения в стратегическата логика. Според Google, платформата Kaggle Game Arena ще продължи да тества моделите в други игри като Го и Werewolf, с цел да ускори развитието на изкуствения интелект към общ интелект (AGI).

history

Последна актуализация

10.08.2025 |
schedule 12:56
Росен Димитров

Росен Димитров

verified Автор