|
摘要: Web规模的合规性面临实际挑战:每个请求可能需要进行监管评估。监管文件(例如《通用数据保护条例》GDPR)具有交叉参考和规范性,而运行时环境以非结构化自然语言表达。在这种设置下,我们被激励将非结构化文本中的语义信息与规定性元素对齐。为此,我们引入了GraphCompliance框架,将监管文件表示为政策图,并将运行时环境表示为上下文图,然后进行对齐。在这种形式化中,政策图编码规范结构和交叉引用,而上下文图将事件形式化为主-动-宾(SAO)和实体-关系三元组。这种对齐将法官大型语言模型(LLM)的推理锚定在结构化信息中,并有助于减轻监管解释和事件分析的负担,从而使关注点集中在核心推理步骤上。在涵盖五个评估任务的300个源自GDPR的真实世界场景的实验中,GraphCompliance相比LLM-only和RAG基线产生了4.1-7.2个百分点(pp)更高的微平均F1值,且少有欠预测和过度预测,导致更高的召回率和更低的误报率。消融研究表明每个图组件的贡献,表明结构化表示和法官LLM对规范性推理是互补的。 更新时间: 2025-10-30 09:53:16 领域: cs.AI,cs.IR,I.2.7
|