摘要: 聚类在各种问题表述中广泛出现,然而大多数现有方法都假设在聚类中的实体是被动的,并且严格服从于其分配的组。然而在现实中,实体往往表现出局部自治性,以不完全被特征表示捕捉到的方式覆盖规定的关联。这种自治性可以显著地重塑聚类结果--改变聚类的组成、几何形状和基数--对推断和决策制定产生重大的下游影响。我们引入了一种自主感知聚类的强化学习(RL)框架,该框架学习和考虑局部自治性的影响,而不需要先验知识其形式。我们的方法将RL与确定性退火(DA)过程相结合,DA自然地在退火的早期阶段促进探索,并在后期过渡到开发。我们还展示了退火过程具有相变,从而能够设计出高效的退火计划。为了进一步增强适应性,我们提出了自适应距离估计网络(ADEN),这是一种基于变压器的注意力模型,它在RL循环中学习实体和聚类代表之间的依赖关系,容纳可变大小的输入和输出,并实现跨不同问题实例的知识转移。实证结果表明我们的框架与底层数据动态密切相关:即使没有明确的自治模型,它也可以实现接近地面真相的解决方案(差距约为3-4%),而忽视自治性会导致更大的差距(约为35-40%)。代码和数据可在https://github.com/salar96/AutonomyAwareClustering 上公开获取。 更新时间: 2025-10-08 16:05:52 领域: cs.LG,cs.AI
|