|
摘要: 随着城市交通复杂性的增加,交通信号控制(TSC)对于优化交通流量和提高道路安全至关重要。大型语言模型(LLMs)被视为TSC的有望方法。然而,在紧急情况下,它们容易产生幻觉,导致不可靠的决策,可能会给紧急车辆造成重大延误。此外,不同类型的交叉口对交通状态编码和交叉口训练提出了重大挑战,限制了跨异质交叉口的泛化。因此,本文提出了增强检索生成(RAG)的分布式LLM代理,并采用应急响应来实现通用TSC(REG-TSC)。首先,本文提出了一个应急感知推理框架,根据紧急情况动态调整推理深度,并配备一种新颖的基于评论者的紧急RAG(RERAG),从历史案例中提炼特定知识和指导,增强代理的紧急决策的可靠性和合理性。其次,本文设计了一种类型无关的交通表示,并提出了一种奖励引导的强化细化(R3)用于异质交叉口。R3根据环境反馈的优先级自适应地从不同的交叉口中采样训练经验,并使用设计的奖励加权似然损失对LLM代理进行微调,引导REG-TSC朝着跨异质交叉口的高奖励策略发展。在三个实际道路网络上的17到177个异质交叉口上,大量实验证明REG-TSC将旅行时间减少了42.00%,队列长度减少了62.31%,紧急车辆等待时间减少了83.16%,优于其他最先进的方法。 更新时间: 2025-10-30 08:23:08 领域: cs.AI
|