找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 18|回复: 0

FOVAL:跨多样化眼动跟踪数据集中无需校准和主体不变的注视深度估计

[复制链接]

334

主题

0

回帖

1027

积分

金牌会员

积分
1027
发表于 2025-9-22 19:43:21 | 显示全部楼层 |阅读模式
摘要: 精确的焦点深度估计对于扩展现实(XR)、机器人技术和人机交互应用至关重要。然而,当前的方法严重依赖于用户特定的校准,这限制了它们的可扩展性和可用性。我们介绍了FOVAL,这是一种稳健的无需校准的方法,它通过长短期记忆(LSTM)网络结合不变主体特征工程和归一化来进行时空序列建模。与Transformer、时间卷积网络(TCN)和卷积神经网络(CNN)相比,FOVAL在限制和嘈杂的凝视数据情境中表现出卓越的性能。通过三个基准数据集的评估,使用留一交叉验证(LOOCV)和跨数据集验证,显示出9.1厘米的平均绝对误差(MAE)和强大的泛化能力,无需校准。我们进一步分析了不同受试者之间的变异性和领域转变,为模型的稳健性和适应性提供了见解。FOVAL的可扩展性和准确性使其非常适合在现实世界中部署。
更新时间: 2025-09-19 14:02:24
领域: cs.CV,cs.AI,cs.HC,cs.LG,eess.SP

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-10-30 16:08 , Processed in 0.085773 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表