2. junija je po poročanju tujih medijev Decoder poročal o 1., serija tekmovanj za kibernetsko varnost, ki jih je nedavno izvajala Palisade Research
Raziskovalna skupina je izvedla dejanske bojne teste na sistemih AI na dveh obsežnih tekmovanjih "Capture the Flag" (CTF), na tisoče igralcev, ki sodelujejo na tekmovanju ., morajo sodelujoče ekipe reševati varnostne težave z razpokanjem šifriranja, identifikacijo šifriranja in iskanjem skritih "zastav"..
Namen testa je preizkusiti, ali lahko agenti AI tekmujejo s človeškimi ekipami . Rezultati kažejo, da je uspešnost AI daleč presegla pričakovanja, večina sodelujočih AI pa je presegla povprečno raven človeških igralcev .
Kompleksnost sodelujočih sistemov AI se spreminja . Nekatere ekipe, kot je CAI, so porabile približno 500 ur za izgradnjo lastnih sistemov, nekatere ekipe, na primer neobremenjene, pa le 17 ur za sodelovanje z optimizacijo pozivov obstoječih modelov Enigma in Claude Code .
V prvem tekmovanju, imenovanem "AI vs . ljudje", je šest ekip AI tekmovalo proti približno 150 človeškim ekipam . vsi igralci so morali v 48 urah izpolniti 20 kriptografije in obratno inženirsko vprašanja .
Štiri od sedmih sodelujočih AIS je uspešno razbil 19 vprašanj . Najvišje uvrščena ekipa AI, uvrščena med najboljših 5% celotnega seznama, njegova skupna uspešnost pa je bila boljša kot pri večini človeških igralcev . Vsa vprašanja o konkurenci se lahko zaženejo lokalno, kar zniža tehnično prago za AI .

Kljub temu nekateri izkušeni človeški igralci še vedno niso zaostajali za . Nekateri igralci so poudarili, da so sodelovali v številnih mednarodnih ekipah, njihova bogata praktična izkušnja in poznavanje skupnih strategij za reševanje problemov pa sta bila ključna za njihovo konkurenčnost .
Druga igra, "Cyber Apocalypse", je bila veliko težja . agenti AI so se morali soočiti z novimi vrstami vprašanj in tekmovati s skoraj 18, 000 človeškimi igralci . veliko od 62 nalog je zahtevalo interakcijo z zunanjimi strežniki, ki so izpodbijali sisteme AI, ki so se predvsem računalniško izračunali {5}
Po poročilih so na tekmovanju sodelovali štirje agenti AI, od katerih je Cai najbolje opravil 20 nalog in se uvrstil na 859. mesto, ki so se uvrstile med najboljših 10% vseh sodelujočih ekip in najboljših 21% aktivnih skupin . palisade raziskave sistema AI.}} 6}}}}}}
Raziskovalci so analizirali tudi težave z vprašanji, ki jih je rešil AI ., ki temeljijo na času, ki ga zahtevajo najvišje človeške ekipe za reševanje vprašanj, ugotovili so, da je imel AI 50 -odstotno uspešnost pri reševanju vprašanj, ki so človeški mojstri vzeli približno 78 minut, da rešijo ., AI ima možnost, da reši težke težave .
