Ejen AI mempunyai keupayaan untuk bersaing dengan penggodam manusia

Jun 06, 2025 Tinggalkan pesanan

Pada 2 Jun, menurut media asing, penyahkod yang dilaporkan pada 1, satu siri pertandingan keselamatan siber baru-baru ini yang diadakan oleh Palisade Research menunjukkan bahawa agen AI mempunyai keupayaan untuk bersaing dengan penggodam manusia, dan juga menang dalam beberapa kesempatan .

 

Pasukan penyelidikan menjalankan ujian tempur sebenar pada sistem AI dalam dua pertandingan "menangkap bendera" (CTF) berskala besar, dengan beribu-ribu pemain yang mengambil bahagian dalam pertandingan . dalam pertandingan tersebut, pasukan yang mengambil bahagian perlu menyelesaikan masalah keselamatan dengan memecahkan enkripsi, mengenal pasti kelemahan, dan mencari bendera "{2}

 

Tujuan ujian adalah untuk menguji sama ada ejen AI boleh bersaing dengan pasukan manusia . hasilnya menunjukkan bahawa prestasi AI jauh melebihi jangkaan, dan kebanyakan AIS yang mengambil bahagian melebihi tahap purata pemain manusia .

 

Kerumitan sistem AI yang mengambil bahagian berbeza -beza . sesetengah pasukan, seperti CAI, menghabiskan kira -kira 500 jam untuk membina sistem mereka sendiri, dan beberapa pasukan, seperti yang tidak dapat ditembusi, hanya menghabiskan 17 jam untuk mengambil bahagian dengan mengoptimumkan model -model yang sedia ada Enigma dan Claude Code {.

 

Dalam pertandingan pertama, yang dipanggil "AI vs . manusia", enam pasukan AI bersaing dengan kira -kira 150 pasukan manusia . semua pemain terpaksa menyelesaikan 20 kriptografi dan membalikkan soalan kejuruteraan dalam masa 48 jam .

 

Empat daripada tujuh AIS yang berpartisipasi berjaya memecahkan 19 soalan . pasukan AI peringkat tertinggi yang disenaraikan dalam 5% daripada jumlah senarai, dan prestasi keseluruhannya lebih baik daripada kebanyakan pemain manusia {{4}

20250213150224

Walaupun begitu, beberapa pemain manusia yang berpengalaman masih tidak tertinggal di belakang . beberapa pemain menegaskan bahawa mereka telah mengambil bahagian dalam banyak pasukan antarabangsa, dan pengalaman praktikal CTF mereka yang kaya dan kebiasaan dengan strategi pemecahan masalah biasa adalah kunci kepada daya saing mereka .

 

Permainan kedua, "Apocalypse Cyber", jauh lebih sukar . ejen AI terpaksa menghadapi jenis soalan baru dan bersaing dengan hampir 18, 000 pemain manusia .

 

Menurut laporan, terdapat empat ejen AI yang mengambil bahagian dalam pertandingan, yang mana CAI melakukan yang terbaik, menyelesaikan 20 tugas dan kedudukan 859, kedudukan dalam 10% teratas dari semua pasukan yang mengambil bahagian dan 21% pasukan aktif.

 

Para penyelidik juga menganalisis kesukaran soalan yang diselesaikan oleh AI . berdasarkan masa yang diperlukan oleh pasukan manusia teratas untuk menyelesaikan soalan -soalan, didapati bahawa AI mempunyai kadar kejayaan 50% dalam menyelesaikan soalan -soalan yang mengambil tuan -tuan manusia kira -kira 78 minit untuk menyelesaikan .