EdgeRunner 20B：在边缘运行时，具有与GPT-5相当的军事任务平等性

于红博 · 发表于 2025-11-2 18:53:36

摘要: 我们提出了EdgeRunner 20B，这是对gpt-oss-20b进行了优化，针对军事任务进行了精细调整的版本。EdgeRunner 20B是在从军事文件和网站中精心筛选的160万条高质量记录上进行训练的。我们还提出了四个新的测试集：(a) 战斗部队，(b) 战斗医疗兵，(c) 网络作战，和 (d) mil-bench-5k（一般军事知识）。在这些军事测试集上，EdgeRunner 20B在95%以上的统计显著性水平上与GPT-5的任务表现相匹配或超越，除了在战斗医疗兵测试集上的高推理设置和mil-bench-5k测试集上的低推理设置。与gpt-oss-20b相比，在类似ARC-C、GPQA Diamond、GSM8k、IFEval、MMLU Pro或TruthfulQA这样的通用基准测试中，没有统计显著的倒退，除了在低推理设置中的GSM8k。我们还对超参数设置、成本和吞吐量进行了分析。这些发现表明，小型、本地托管的模型是在数据敏感操作中的理想解决方案，例如在军事领域，可以部署在空间隔离的边缘设备上。

更新时间: 2025-10-30 14:43:26

领域: cs.AI

下载: http://arxiv.org/abs/2510.26550v1

		自动登录	找回密码
密码			立即注册