|
摘要: 现代天文台的竞争性获取已经加剧,由于提案数量超过了可用的望远镜时间,因此及时、一致和透明的同行评审对于天文学的进展至关重要。因此,自动化这个过程的部分是科学上重要的,也是运作上必要的,以确保公平分配和可重复的决策规模化。我们提出了AstroReview,这是一个开放源代码的基于代理的框架,可以自动化提案评审的三个阶段:(一)新颖性和科学价值,(二)可行性和预期收益,以及(三)元审查和可靠性验证。任务分离和明确的推理过程可以抑制幻觉并提高透明度。在我们的实验中,AstroReview仅在最后一个阶段使用,而无需任何领域特定的微调,就能正确识别真正被接受的提案,准确率为87%。AstroReview in Action模块复制了审查和改进循环;通过其集成的提案创作代理,修订草稿的接受率在两次迭代后增加了66%,表明迭代反馈结合自动化的元审查和可靠性验证可以带来可衡量的质量提升。总的来说,这些结果指向了一条实用的途径,可以为资源有限的设施提供可扩展的、可审计的和更高通量的提案审查。 更新时间: 2025-12-31 09:55:18 领域: astro-ph.IM,cs.AI
|