|
摘要: 随着网络威胁规模和复杂性不断增长,蓝队防御者越来越需要先进工具来主动检测和减轻风险。大型语言模型(LLMs)为增强威胁分析提供了有希望的能力。然而,它们在现实世界的蓝队威胁猎杀场景中的有效性仍未充分探讨。本文介绍了CyberTeam,一个旨在指导LLMs蓝队实践的基准。CyberTeam分为两个阶段构建了一个标准化的工作流程。首先,通过捕捉从威胁归因到事件响应的各种分析任务之间的依赖关系,模拟了现实威胁猎杀工作流程。接下来,针对每个任务,通过一组适应其特定分析需求的操作模块来解决。这将威胁猎杀转变为一系列有结构的推理步骤,每一步都基于一个离散的操作,并根据任务特定的依赖关系进行排序。在这个框架的指导下,LLMs通过模块化的步骤执行威胁猎杀任务。总体而言,CyberTeam整合了30个任务和9个操作模块,以指导LLMs进行标准化的威胁分析。我们评估了领先的LLMs和最新的网络安全代理,将CyberTeam与开放式推理策略进行了比较。我们的结果突显了标准化设计所带来的改进,同时也揭示了开放式推理在现实世界威胁猎杀中的局限性。 更新时间: 2025-09-28 02:08:17 领域: cs.CR,cs.AI
|