自动学会工具解题,RL扩展催化奥数能力激增17%
在大模型推理能力提升的探索中,工具使用一直是克服语言模型计算局限性的关键路径。不过,当今的大模型在使用工具方面…
在大模型推理能力提升的探索中,工具使用一直是克服语言模型计算局限性的关键路径。不过,当今的大模型在使用工具方面…
2025 年,随着 OpenAI 的 DeepResearch 和 Claude Sonnet 3.7 的发布…
编辑 | 杨文 好消息!好消息! ChatGPT 图像生成功能现已对所有用户开放啦! 换句话说,即使是免费用户…
DeepSeek 的风甚至吹到了美妆区。近日,一小红书博主跟足 DeepSeek 指示上妆,意外打造出「石矶娘…
近日,Deepseek R1 等一系列推理大语言模型已成为 2025 年最热门的话题之一。在过去的几周里,研究…
项目地址:https://github.com/XinyiYing/RGBT-Tiny 论文链接:https:…
编辑 | 2049 在全球生物多样性快速丧失的背景下,准确理解和监测生物多样性变化显得尤为重要。 目前全球约有…
编辑 | 萝卜皮 原子结构的高分辨率可视化对于理解材料微观结构与宏观性质之间的关系具有重要意义。然而,在原子分…
3 月 29 日,智源研究院在 2025 中关村论坛 “未来人工智能先锋论坛” 上发布首个跨本体具身大小脑协作…
DeepSeek-R1 的成功离不开一种强化学习算法:GRPO(组相对策略优化)。 不同于 PPO(近端策略优…