找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
订阅

AI综合 今日: 0|主题: 329|排名: 18 

作者 回复/查看 最后发表
公告: 点此查看Octave学习资源大合集 admin 2025-8-13    
计划然后检索:强化学习引导的知识图上的复杂推理 New 于红博 3 天前 011 于红博 3 天前
探索大型语言模型用于访问控制策略合成和总结 New 于红博 3 天前 07 于红博 3 天前
叠加产生稳健的神经缩放效应 New 于红博 3 天前 04 于红博 3 天前
融合叙事语义用于金融波动预测 New 于红博 3 天前 03 于红博 3 天前
四足动物的实时步态适应性:使用模型预测控制和强化学习 New 于红博 3 天前 07 于红博 3 天前
TabR1:驯服用于表格推理的LLMs的GRPO New 于红博 3 天前 08 于红博 3 天前
大视觉语言模型推理的快慢思维GRPO New 于红博 3 天前 07 于红博 3 天前
停止总结:最小形式的信用分配是推理所需的所有过程奖励模型。 New 于红博 3 天前 06 于红博 3 天前
聪明:一个用于形式验证代码生成的精心策划基准 New 于红博 3 天前 010 于红博 3 天前
N-BEATS和图神经网络在多变量半导体工艺时间序列中的无监督异常预测 New 于红博 3 天前 08 于红博 3 天前
用户对LLM在处理隐私敏感场景中的隐私和帮助性的看法 New 于红博 3 天前 06 于红博 3 天前
自然语言处理技术在临床记录中自动提取氟嘧啶治疗及相关毒副作用 New 于红博 3 天前 06 于红博 3 天前
使用多代理系统通过横向对角门共同设计量子码 New 于红博 3 天前 08 于红博 3 天前
多智能体协作中的思维沟通 New 于红博 3 天前 08 于红博 3 天前
证明代理:一种基于代理的形式数学证明框架 New 于红博 3 天前 06 于红博 3 天前
在文本属性图中集成结构和语义信号与BiGTex New 于红博 3 天前 05 于红博 3 天前
共情提示:多模式LLM对话的非语言上下文集成 New 于红博 3 天前 05 于红博 3 天前
可解释人工智能中的隐私风险和保护方法:范围审查 New 于红博 3 天前 06 于红博 3 天前
FlyLoRA:通过隐式逐级专家混合提高任务解耦和参数效率 New 于红博 3 天前 04 于红博 3 天前
强化学习与消费储蓄行为 New 于红博 3 天前 07 于红博 3 天前
下一页 »

快速发帖

还可输入 80 个字符
您需要登录后才可以发帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|Octave中文网学术交流论坛 ( 黑ICP备2024030411号-2 )

GMT+8, 2025-10-30 06:11 , Processed in 0.062799 second(s), 12 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

返回顶部 返回版块