全球规模最大的去中心化AI红队测试赛圆满落幕

近日,一个专注于构建人类主导的AI评估基础设施的去中心化平台公布了其公开对抗测试挑战赛的最终成果。本次赛事吸引了来自全球的14,959名参与者,累计提交64,526条对抗性提示,旨在攻破一个运行在Solana网络上的自主AI智能体。 最终,有5名参与者成功实现“越狱”,从该AI链上奖金池中获得了价值超过28,000美元的SOL代币奖励。主办方表示,此次挑战为公开AI“红队测试”树立了新的标杆,标志着人类参与模式在模型安全性验证中的关键作用。

基于链上激励的智能体对抗机制

挑战中的AI智能体在Solana区块链上拥有独立钱包与可编程奖金池。参赛者仅能通过自然语言对话,运用说服、提示注入、逻辑漏洞利用、情感操控等策略尝试绕过系统防御。 核心数据表明: - 参与攻击的用户数量:14,959名 - 提交的对抗性提示总数:64,526条 - 成功突破防线次数:5次 - 链上发放的SOL奖励总额:超过28,000美元 平台将所有积分购买收入的70%注入奖金池,确保激励可持续。所有奖励均从AI钱包直接透明发放,每次交互生成结构化对抗数据,涵盖提示注入尝试、说服模式、边界利用策略及对齐测试等维度。这些数据集对提升现代AI系统的鲁棒性与可信度具有重要意义。

构建可扩展的人类参与式安全评估体系

平台首席执行官指出:“AI无法自我评估,而人类的判断不可或缺。但此前缺乏大规模调动人类参与的基础设施。我们在Solana上构建了这一系统,并成功吸引近1.5万名参与者进行真实世界测试。其成果是目前公开生成的最大规模对抗性数据集之一。” 该模式摒弃传统依赖内部团队或付费标注人员的局限,转而通过经济激励机制激发公众主动探查模型弱点。相比以往链上实验,本次挑战在参与人数、数据体量与真实场景覆盖方面均实现跨越式突破。 Solana区块链作为底层架构,使智能体具备资产存储、自动分发与结果不可篡改记录的能力,为去中心化评估提供了坚实技术支撑。

迈向下一代智能体协同评估生态

此次挑战是平台的首次公开部署。未来,平台计划扩展系统能力,支持更多类型AI评估任务与数据生成活动。下一项挑战即将启动,新的AI智能体将在多个环境中上线,进一步拓展消费级红队测试的覆盖面。 同时,平台正推进第三代系统开发,目标是整合智能体间对抗测试、数据标注服务、偏好评估与企业级模型验证功能,打造统一的生态系统。 其愿景是成为AI发展的参与层——将对抗测试、数据生成与模型验证转化为具备真实经济激励的消费级体验,持续激励大规模人类参与,从而生成高质量、高可信度的数据资源,助力现代人工智能的安全演进。