找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 21|回复: 0

CIDER: 品牌迷恋文本到图像模型的因果疗法

[复制链接]

334

主题

0

回帖

1027

积分

金牌会员

积分
1027
发表于 2025-9-22 19:59:56 | 显示全部楼层 |阅读模式
摘要: 文本到图像(T2I)模型展示了一个显著但未被充分探索的“品牌偏见”,即生成出现主要商业品牌的内容倾向于从通用提示中产生,从而带来道德和法律风险。我们提出了CIDER,一个新颖的、与模型无关的框架,通过提示细化来在推断时减轻偏见,避免昂贵的重新训练。CIDER使用一个轻量级检测器来识别品牌内容,以及一个视觉语言模型(VLM)生成风格不同的替代内容。我们引入了品牌中立评分(BNS)来量化这个问题,并在领先的T2I模型上进行了广泛的实验。结果显示,CIDER显著减少了明示和隐含偏见,同时保持了图像质量和美学吸引力。我们的工作为更具原创性和公平性的内容提供了一个实际的解决方案,有助于可信赖生成式AI的发展。
更新时间: 2025-09-19 09:30:37
领域: cs.CV,cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-10-30 08:39 , Processed in 0.077918 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表