找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 44|回复: 0

VLA-Mark:用于大规模视觉语言对齐模型的跨模态水印

[复制链接]

334

主题

0

回帖

1027

积分

金牌会员

积分
1027
发表于 2025-9-22 20:04:27 | 显示全部楼层 |阅读模式
摘要: 视觉语言模型需要水印解决方案,以保护知识产权而不影响多模态一致性。现有的文本水印方法通过偏向性令牌选择和静态策略破坏了视觉-文本对齐,使语义关键概念容易受到攻击。我们提出了VLA-Mark,这是一个视觉对齐框架,通过跨模态协调保留语义保真度的同时嵌入可检测的水印。我们的方法整合了多尺度视觉-文本对齐指标,结合了局部补丁亲和性、全局语义一致性和上下文关注模式,以指导水印注入而无需重新训练模型。一种熵敏感机制动态平衡水印强度和语义保留,优先考虑视觉基础在低不确定性生成阶段。实验结果显示,与传统方法相比,PPL降低了7.4%,BLEU提高了26.6%,检测几乎完美(98.8%的AUC)。该框架表现出96.1%的抵抗攻击能力,例如改写和同义词替换,同时保持文本-视觉一致性,为保持质量的多模态水印设立了新标准。
更新时间: 2025-09-19 06:54:08
领域: cs.CV,cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-10-30 06:17 , Processed in 0.072510 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表