找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 45|回复: 0

EdgeRunner 20B:在边缘运行时,具有与GPT-5相当的军事任务平等性

[复制链接]

622

主题

0

回帖

1895

积分

金牌会员

积分
1895
发表于 2025-11-2 18:53:36 | 显示全部楼层 |阅读模式
摘要: 我们提出了EdgeRunner 20B,这是对gpt-oss-20b进行了优化,针对军事任务进行了精细调整的版本。EdgeRunner 20B是在从军事文件和网站中精心筛选的160万条高质量记录上进行训练的。我们还提出了四个新的测试集:(a) 战斗部队,(b) 战斗医疗兵,(c) 网络作战,和 (d) mil-bench-5k(一般军事知识)。在这些军事测试集上,EdgeRunner 20B在95%以上的统计显著性水平上与GPT-5的任务表现相匹配或超越,除了在战斗医疗兵测试集上的高推理设置和mil-bench-5k测试集上的低推理设置。与gpt-oss-20b相比,在类似ARC-C、GPQA Diamond、GSM8k、IFEval、MMLU Pro或TruthfulQA这样的通用基准测试中,没有统计显著的倒退,除了在低推理设置中的GSM8k。我们还对超参数设置、成本和吞吐量进行了分析。这些发现表明,小型、本地托管的模型是在数据敏感操作中的理想解决方案,例如在军事领域,可以部署在空间隔离的边缘设备上。
更新时间: 2025-10-30 14:43:26
领域: cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2026-1-12 18:33 , Processed in 0.075598 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表