|
摘要: 最近,Hendrycks等人的研究正式将人工通用智能(AGI)定义为从Cattell-Horn-Carroll(CHC)人类认知模型中得出的认知领域能力的算术平均值。虽然这一定义优雅,但假设了“可补偿性”——即在某些领域具有出色能力可以弥补其他领域的失败。然而,真正的通用智能应该体现“一致充分性”:在所有必要领域中具有平衡的能力。我们提出了一种基于补偿指数连续体上的广义平均值积分的一致性感知AGI度量。这种表述涵盖了算术、几何和调和制度,而由此产生的曲线下面积(AUC)量化了在不同补偿假设下的稳健性。与算术平均值不同,后者奖励专业化,而AUC则惩罚不平衡并捕捉领域间依赖关系。将该方法应用于GPT-4和GPT-5的已发表的基于CHC的领域得分,一致性调整后的AUC显示出尽管在算术得分上表现出色(例如,GPT-5为24\%),但这两个系统仍然远未达到一般能力。因此,整合广义平均值为实现AGI的真正进展提供了一个基于原则、可解释且更严格的基础。 更新时间: 2025-10-23 17:51:42 领域: cs.AI,cs.LG
|