安全蛋白质：蛋白质基础模型的红队框架和基准

于红博 · 发表于 2025-10-9 16:31:46

摘要: 蛋白质在几乎所有生物过程中起着至关重要的作用。深度学习的进步极大加快了蛋白质基础模型的发展，取得了在蛋白质理解和设计方面的重大成功。然而，这些模型缺乏系统的红队测试，引发了人们对其潜在滥用的严重担忧，比如生成具有生物安全风险的蛋白质。本文介绍了SafeProtein，据我们所知，这是第一个专为蛋白质基础模型设计的红队框架。SafeProtein结合了多模态提示工程和启发式搜索，系统地设计红队方法并对蛋白质基础模型进行测试。我们还整理了SafeProtein-Bench，其中包括手工构建的红队基准数据集和全面的评估协议。SafeProtein在最先进的蛋白质基础模型上取得了持续的越狱成功（对于ESM3的攻击成功率高达70%），揭示了当前蛋白质基础模型存在潜在的生物安全风险，并为前沿模型的健壮安全保护技术的发展提供了见解。这些代码将在https://github.com/jigang-fan/SafeProtein上公开。

更新时间: 2025-10-08 17:47:56

领域: cs.LG,cs.AI,cs.CR,q-bio.BM,q-bio.QM

下载: http://arxiv.org/abs/2509.03487v2

		自动登录	找回密码
密码			立即注册

安全蛋白质：蛋白质基础模型的红队框架和基准

浏览过的版块