找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
订阅

AI综合 今日: 0|主题: 329|排名: 18 

作者 回复/查看 最后发表
通过成对比较在线获取评分标准 于红博 2025-10-9 014 于红博 2025-10-9 16:32
GTCN-G:一种用于不平衡入侵检测的剩余图时空融合网络(预印本) 于红博 2025-10-9 015 于红博 2025-10-9 16:32
蛋白质适应性预测的进化特征Profiles 于红博 2025-10-9 011 于红博 2025-10-9 16:32
安全蛋白质:蛋白质基础模型的红队框架和基准 于红博 2025-10-9 014 于红博 2025-10-9 16:31
Dyna-Think:在AI代理中协同推理、行动和世界模型模拟 于红博 2025-10-9 012 于红博 2025-10-9 16:31
利用不完美的合成数据进行有效推理 于红博 2025-10-9 011 于红博 2025-10-9 16:31
茧:一种用于具有相关噪声的差分私密训练的系统架构 于红博 2025-10-9 08 于红博 2025-10-9 16:30
MLE-Smith:使用自动化多智能体管道扩展MLE任务 于红博 2025-10-9 08 于红博 2025-10-9 16:30
使用强化学习通过引导LLMs对更长期未来进行推理 于红博 2025-10-9 015 于红博 2025-10-9 16:30
Vibe Checker: 将代码评估与人类偏好对齐 于红博 2025-10-9 013 于红博 2025-10-9 16:30
NdLinear:保留多维结构以实现参数高效的神经网络 于红博 2025-10-9 010 于红博 2025-10-9 16:29
人工海马网络用于高效的长上下文建模 于红博 2025-10-9 019 于红博 2025-10-9 16:29
STAR-XAI协议:在AI代理中诱导和验证代理、推理和可靠性的框架 于红博 2025-9-30 032 于红博 2025-9-30 19:51
学习A*算法的可接受启发式:理论与实践 于红博 2025-9-30 019 于红博 2025-9-30 19:50
StateX:通过后训练状态扩展增强RNN召回率 于红博 2025-9-30 029 于红博 2025-9-30 19:50
大规模预训练数据集并不总是在微调后保证稳健性 于红博 2025-9-30 033 于红博 2025-9-30 19:49
学习全球化,说本地化:弥合多语言推理的差距 于红博 2025-9-30 023 于红博 2025-9-30 19:49
朝向有效的在线探索:通过人类反馈进行强化学习 于红博 2025-9-30 029 于红博 2025-9-30 19:49
语言模型的变分推理 于红博 2025-9-30 025 于红博 2025-9-30 19:48
语言模型可以从口头反馈中学习,无需标量奖励 于红博 2025-9-30 031 于红博 2025-9-30 19:48
下一页 »

快速发帖

还可输入 80 个字符
您需要登录后才可以发帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-10-30 03:59 , Processed in 0.049838 second(s), 12 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

返回顶部 返回版块