揭示显式CoT训练机制:思维链如何增强推理泛化能力
基于逐步生成解决方案的大语言模型(LLMs)训练范式在人工智能领域获得了广泛关注,并已发展成为行业内的主流方法…
基于逐步生成解决方案的大语言模型(LLMs)训练范式在人工智能领域获得了广泛关注,并已发展成为行业内的主流方法…
在 AIGC 持续突破视频生成边界的当下,音效制作仍是制约行业发展的瓶颈。字节跳动豆包大模型语音团队最新提出的…
李飞飞「具身智能」又出新研究了。 「机器人学习领域中的一个『圣杯』级挑战是执行通用的日常家庭移动操作任务。借助…
编辑 | Sia 「盘腿」的机器人见过不少:履带、两轮、四轮、四条腿、两条腿…… 盘「…
前段时间,幻方科技、DeepSeek 创始人梁文锋亲自挂名的一篇论文传遍了全球互联网。 论文地址:https:…
没有任何冷启动数据,7B 参数模型能单纯通过强化学习学会玩数独吗? 近日,技术博主 Hrishbh Dalal…
编辑 | ScienceAI 在追求更强大 AI 系统的道路上,大语言模型处理长上下文的能力始终是制约其发展的…
编辑 | 萝卜皮 深度生成模型推动了药物发现,但生成的化合物通常结构新颖性有限,限制了药物化学家的灵感。 为了…
12.98 万元标配激光雷达 + 端到端智驾,通义千问 + DeepSeek 双模型智能座舱。 进入 2025…
兰宇时,MMLab@NTU博士生,导师为 Chen Change Loy。本科毕业于北京邮电大学,目前主要研究…