找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 17|回复: 0

结构化信息用于改善文本到图像生成中的空间关系

[复制链接]

334

主题

0

回帖

1027

积分

金牌会员

积分
1027
发表于 2025-9-22 19:47:28 | 显示全部楼层 |阅读模式
摘要: 文本到图像(T2I)生成已经迅速发展,但忠实地捕捉自然语言提示中描述的空间关系仍然是一个主要挑战。先前的努力通过提示优化、空间基础生成和语义细化来解决这个问题。本文介绍了一种轻量级方法,通过使用经过微调的语言模型将元组结构化信息与提示相结合,实现自动转换并无缝集成到T2I管道中。实验结果表明,在不影响Inception Score所衡量的整体图像质量的情况下,空间准确性得到了显著提高。此外,自动生成的元组展现出与人工制作的元组相媲美的质量。这种结构化信息为增强T2I生成中的空间关系提供了一个实用且可移植的解决方案,解决了当前大规模生成系统的一个关键限制。
更新时间: 2025-09-19 13:20:34
领域: cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-10-30 08:42 , Processed in 0.071444 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表