|
摘要: 心理测量对许多学科至关重要。尽管在测量方面取得了进展,但构建概念和测量之间关系的理论图谱,以建立有效性的概念网络,仍然是一个挑战。克朗巴赫和米尔提出它们作为验证的基础70年后,这一局限性具有实际后果:临床试验可能无法检测治疗效果,公共政策可能将目标对准错误的结果。我们介绍了基于大型语言模型的“分析潜在指标生成概念结构”(ALIGNS)系统,该系统经过训练使用验证的问卷测量。ALIGNS提供三个包含超过55万个指标的综合概念网络,涵盖了心理学、医学、社会政策和其他领域。这代表了大型语言模型首次应用于解决测量验证中的基础性问题。我们报告了用于开发模型的分类准确性测试,以及三个评估结果。在第一个评估中,广泛使用的NIH PROMIS焦虑和抑郁仪器被证明汇聚成一个情绪困扰的维度。第二个评估检查了儿童气质测量,并确定了四个潜在维度,这些维度未被当前框架捕获,并质疑了一个现有维度。第三个评估是一个适用性检查,涉及专家心理测量学家评估系统的重要性、可访问性和适用性。ALIGNS可在nomologicalnetwork.org免费获得,通过大规模概念分析补充传统的验证方法。 更新时间: 2025-09-18 16:46:59 领域: cs.CL,cs.AI,cs.LG,stat.ME,I.2.6; J.4; I.5.1; H.3.3; H.2.8
|