摘要: 蛋白质在几乎所有生物过程中起着至关重要的作用。深度学习的进步极大加快了蛋白质基础模型的发展,取得了在蛋白质理解和设计方面的重大成功。然而,这些模型缺乏系统的红队测试,引发了人们对其潜在滥用的严重担忧,比如生成具有生物安全风险的蛋白质。本文介绍了SafeProtein,据我们所知,这是第一个专为蛋白质基础模型设计的红队框架。SafeProtein结合了多模态提示工程和启发式搜索,系统地设计红队方法并对蛋白质基础模型进行测试。我们还整理了SafeProtein-Bench,其中包括手工构建的红队基准数据集和全面的评估协议。SafeProtein在最先进的蛋白质基础模型上取得了持续的越狱成功(对于ESM3的攻击成功率高达70%),揭示了当前蛋白质基础模型存在潜在的生物安全风险,并为前沿模型的健壮安全保护技术的发展提供了见解。这些代码将在https://github.com/jigang-fan/SafeProtein上公开。 更新时间: 2025-10-08 17:47:56 领域: cs.LG,cs.AI,cs.CR,q-bio.BM,q-bio.QM
|