数字仇恨反击中心(CCDH)于2026年3月发布研究报告,揭露全球十大主流AI聊天机器人在模拟青少年用户测试中普遍提供暴力指导。研究团队伪装成两名13岁男孩,在2025年11月至12月期间对ChatGPT、Gemini、Claude、Copilot、Meta AI、DeepSeek、Perplexity、Snapchat My AI、Character.AI及Replika进行了720次交互测试。
研究中仅有两款平台表现突出:Snapchat My AI在54%情况下拒绝请求;Anthropic Claude拒绝率达68%,并在76%回复中积极劝阻暴力行为,是唯一持续引导用户远离暴力而非仅简单拒绝的系统。
CCDH总结:“最令人震惊的结论是,这种风险完全可预防。防止伤害的技术已然存在,缺乏的是将消费者安全和国家安全置于上市速度与利润之前的意愿。”