AI 智能体已具备与人类黑客正面较量的能力,部分情况甚至能取胜

内容摘要IT之家 6 月 2 日消息,据外媒 The Decoder 1 日报道,Palisade Research 最近举办的一系列网络安全竞赛表明,AI 智能体已具备与人类黑客正面较量的能力,甚至在部分场合中胜出。研究团队在两场大规模的“夺旗赛

IT之家 6 月 2 日消息,据外媒 The Decoder 1 日报道,Palisade Research 最近举办的一系列网络安全竞赛表明,AI 智能体已具备与人类黑客正面较量的能力,甚至在部分场合中胜出。

研究团队在两场大规模的“夺旗赛”(CTF)中对 AI 系统进行了实战测试,数千名选手参与角逐。在这类比赛中,参赛队伍需通过破解加密、识别漏洞等方式解决安全难题,找到隐藏的“旗帜”。

测试的目的是检验 AI 智能体能否与人类队伍抗衡。结果显示,AI 的表现远超预期,大多数参赛 AI 都超过了人类选手的平均水平。

参赛的 AI 系统复杂程度各不相同。有的团队如 CAI 花费约 500 小时打造专属系统,也有像 Imperturbable 团队仅花 17 小时就通过优化现有模型 EnIGMA 和 Claude Code 的提示词参赛。

在首场名为“AI vs. Humans”的比赛中,六支 AI 团队与约 150 支人类队伍展开比拼。所有选手需在 48 小时内完成 20 道密码学与逆向工程题目。

七个参赛 AI 中有四个成功破解了其中 19 道题。排名最高的 AI 团队位列总榜前 5%,整体表现优于大多数人类选手。比赛题目均可在本地运行,降低了 AI 的技术门槛。

尽管如此,部分经验丰富的人类选手依旧不落下风。有选手指出,自己曾参加多支国际强队,丰富的 CTF 实战经验和对常用解题策略的熟悉,是他们保持竞争力的关键。

第二场“Cyber Apocalypse”则难度大幅升级。AI 智能体需面对全新题型,并与近 18000 名人类玩家同台竞技。62 项任务中,不少要求与外部服务器进行交互,对主要依赖本地计算的 AI 系统提出挑战。

IT之家从报道中获悉,本场共有四个 AI 智能体参赛,其中 CAI 表现最佳,完成了 20 项任务,排名第 859 位,位列全部参赛队伍前 10%、活跃队伍前 21%。Palisade Research 表示,该 AI 系统的表现超过了约 90% 的人类团队。

研究人员还分析了 AI 所破解题目的难度。以人类顶尖队伍解题所需时间为参考,发现 AI 有 50% 成功率解出人类高手也需约 78 分钟才能破解的题目。换言之,AI 已具备解决高难度问题的能力。

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
浙ICP备19001410号-1