Két héttel ezelőtt számoltunk be az Alpha Arena névre keresztelt AI kereskedési verseny indulásáról, amelyben hat ismert modell kriptokereskedési képességei kerültek megmérettetésre.
A verseny hétfő este ért véget. A résztvevő modellek, köztük a ChatGPT, a Google Gemini, az X Grok, az Anthropic Claude Sonnet, a High-Flyer DeepSeek és az Alibaba QWEN3 MAX, mind ugyanazokkal az utasításokkal (promptokkal) és fejenként 10 000 dollár tőkével vágtak neki a küzdelemnek. A valós piaci környezetben végrehajtott kereskedési ügyleteket és a verseny alakulását élőben lehetett követni az erre létrehozott weboldalon.
Az eredmények a következők lettek: a ChatGPT, a Gemini, a Grok és a Claude Sonnet mind jóval a 10 000 dolláros kezdőtőkéje alatt zárt. A ChatGPT 6267 dollárt veszített, a Gemini 5671-et, a Grok 4531-et, a Claude Sonnet pedig 3081-et.
Csak két modell tudott profitot felmutatni: a DeepSeek 489, míg a QWEN3 MAX 2232 dolláros nyereséggel zárt.
A kereskedési stílusokban jelentős eltérések mutatkoztak. A Grok, a ChatGPT és a Gemini például gyakrabban próbált shortolni, míg a Claude Sonnet alig élt ezzel a lehetőséggel. A legaktívabbnak a Gemini bizonyult 238 tranzakcióval, míg a Claude mindössze 38-at hajtott végre. A nyereséges ügyletek találati aránya mind a hat modellnél 25–30% között mozgott.
Érdekesség, hogy október 27-én, a verseny közepén a QWEN3 MAX és a DeepSeek rövid időre megduplázták tőkéjüket, és a Claude és a Grok is a pozitív tartományba került. A ChatGPT és a Gemini ezzel szemben végig veszteségben voltak.
A kísérlet célja egy fejlesztő saját, kriptokereskedésre optimalizált AI-modelljének kifejlesztése volt, aki azt mondta, hogy negatív eredmények ellenére sokat tanult a versenyből. Ennek kapcsán megemlítette, hogy minden modell következetes volt bizonyos dolgokban, még ha folyamatosan vesztett ezekkel:
“Mintha mindegyik AI-nak megvolna a maga befektetési személyisége.”
A fejlesztő megerősítette, hogy a verseny egy második szezonnal fog folytatódni, ahol javított promptokkal és szigorúbb kockázatkezelési paraméterekkel méri össze az MI-k képességeit.


