找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 4|回复: 0

mHC:流形约束的超连接

[复制链接]

622

主题

0

回帖

1895

积分

金牌会员

积分
1895
发表于 2026-1-4 23:00:59 | 显示全部楼层 |阅读模式
摘要: 最近的研究,例如Hyper-Connections(HC),通过扩大残差流宽度和多样化连接模式,扩展了过去十年建立的普遍残差连接范式。虽然产生了可观的性能提升,但这种多样化基本上损害了残差连接固有的身份映射属性,导致严重的训练不稳定性和有限的可伸缩性,并且还带来显著的内存访问开销。为了解决这些挑战,我们提出了Manifold-Constrained Hyper-Connections(mHC),这是一个将HC的残差连接空间投影到特定流形上以恢复身份映射属性的通用框架,同时结合严格的基础设施优化以确保效率。经验实验证明,mHC对于规模化训练是有效的,提供了明显的性能改进和更优越的可伸缩性。我们预计,作为HC的灵活实用的扩展,mHC将有助于对拓扑架构设计的深入理解,并为基础模型的演进提出有前途的方向。
更新时间: 2025-12-31 14:16:26
领域: cs.CL,cs.AI,cs.LG

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2026-1-12 17:00 , Processed in 0.088848 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表