找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 2|回复: 0

大型语言模型的数据来源:一项调查

[复制链接]

622

主题

0

回帖

1895

积分

金牌会员

积分
1895
发表于 2026-1-4 23:16:50 | 显示全部楼层 |阅读模式
摘要: 由于大型语言模型(LLMs)的黑盒特性和其生成内容的逼真性,问题如幻觉、偏见、不公平和侵犯版权已变得重要。在这种背景下,从多个角度获取信息至关重要。本调查提出了一个系统性研究,围绕四个相关维度展开:模型获取、模型结构获取、训练数据获取和外部数据获取。此外,提出了一个统一的双范式分类法,将现有的获取方法分类为基于先验的(主动可追溯嵌入)和基于后验的(回顾性推理)方法。跨越这些维度的可追溯性增强了LLMs在现实应用中的透明度、责任制和可信度。
更新时间: 2025-12-31 06:20:51
领域: cs.CL,cs.AI

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2026-1-13 09:36 , Processed in 0.079530 second(s), 21 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表