CIDER: 品牌迷恋文本到图像模型的因果疗法

于红博 · 发表于 2025-9-22 19:59:56

摘要: 文本到图像（T2I）模型展示了一个显著但未被充分探索的“品牌偏见”，即生成出现主要商业品牌的内容倾向于从通用提示中产生，从而带来道德和法律风险。我们提出了CIDER，一个新颖的、与模型无关的框架，通过提示细化来在推断时减轻偏见，避免昂贵的重新训练。CIDER使用一个轻量级检测器来识别品牌内容，以及一个视觉语言模型（VLM）生成风格不同的替代内容。我们引入了品牌中立评分（BNS）来量化这个问题，并在领先的T2I模型上进行了广泛的实验。结果显示，CIDER显著减少了明示和隐含偏见，同时保持了图像质量和美学吸引力。我们的工作为更具原创性和公平性的内容提供了一个实际的解决方案，有助于可信赖生成式AI的发展。

更新时间: 2025-09-19 09:30:37

领域: cs.CV,cs.AI

下载: http://arxiv.org/abs/2509.15803v1

		自动登录	找回密码
密码			立即注册

CIDER: 品牌迷恋文本到图像模型的因果疗法

浏览过的版块