摘要: 大型语言模型(LLM)代理在解决现实世界数据科学问题方面显示出巨大潜力。以LLM为驱动的数据科学代理承诺自动化整个机器学习流程,但它们在现实世界中的有效性仍然有限。现有框架依赖于刚性、预定义的工作流程和不灵活的编码策略;因此,它们只在相对简单、传统的问题上表现出色,无法捕捉人类从业者在复杂、创新任务中带来的经验知识。在这项工作中,我们介绍了AutoMind,一种自适应、知识丰富的LLM代理框架,通过三个关键进展克服了这些缺陷:(1)一个策划的专家知识库,使代理在领域专家知识中立足,(2)一种具有知识的代理树搜索算法,策略性地探索可能的解决方案,以及(3)一种自适应编码策略,动态地根据任务复杂性定制代码生成。对两个自动化数据科学基准的评估表明,AutoMind相对于最先进的基线模型提供了优越的性能。额外的分析证实了有利的有效性、效率和定性解决方案质量,突显AutoMind作为全自动数据科学的高效和稳健步骤。代码位于https://github.com/innovatingAI/AutoMind。 更新时间: 2025-10-08 17:06:47 领域: cs.CL,cs.AI,cs.HC,cs.LG,cs.MA
|