|
摘要: 我们提出了EdgeRunner 20B,这是对gpt-oss-20b进行了优化,针对军事任务进行了精细调整的版本。EdgeRunner 20B是在从军事文件和网站中精心筛选的160万条高质量记录上进行训练的。我们还提出了四个新的测试集:(a) 战斗部队,(b) 战斗医疗兵,(c) 网络作战,和 (d) mil-bench-5k(一般军事知识)。在这些军事测试集上,EdgeRunner 20B在95%以上的统计显著性水平上与GPT-5的任务表现相匹配或超越,除了在战斗医疗兵测试集上的高推理设置和mil-bench-5k测试集上的低推理设置。与gpt-oss-20b相比,在类似ARC-C、GPQA Diamond、GSM8k、IFEval、MMLU Pro或TruthfulQA这样的通用基准测试中,没有统计显著的倒退,除了在低推理设置中的GSM8k。我们还对超参数设置、成本和吞吐量进行了分析。这些发现表明,小型、本地托管的模型是在数据敏感操作中的理想解决方案,例如在军事领域,可以部署在空间隔离的边缘设备上。 更新时间: 2025-10-30 14:43:26 领域: cs.AI
|