只用图像也能思考,强化学习造就推理模型新范式!复杂场景规划能力Max
近年来,LLM 及其多模态扩展(MLLM)在多种任务上的推理能力不断提升。然而, 现有 MLLM 主要依赖文本…
近年来,LLM 及其多模态扩展(MLLM)在多种任务上的推理能力不断提升。然而, 现有 MLLM 主要依赖文本…
自 Anthropic 推出 Claude Computer Use,打响电脑智能体(Computer Use…
OpenAI 研究员姚顺雨近期发布文章,指出:AI 下半场将聚焦问题定义与评估体系重构。在 AI 发展新阶段,…
本文的共同第一作者为字节跳动算法工程师王安澜和廖蕾,本文的通讯作者为字节跳动算法工程师唐景群。 在文档理解领域…
加法,这项我们从幼儿园就掌握的运算,竟然蕴藏着未解之谜。 它是一项简单的运算:我们学到的第一个数学真理便是 1…
最近,AI 在数学和编程上的能力飞跃令人瞠目结舌 —— 在不少任务上,它已经悄然超越了我们大多数人类。而当它面…
深圳市大数据研究院、香港中文大学(深圳)研究团队最新研究发现, 这类特殊的矩阵乘法可以进一步加速,并在强化学习…
本文详细解读了 Kimi k1.5、OpenReasonerZero、DAPO 和 Dr. GRPO 四篇论文…
编辑 | Sia 老铁们,2025 年了。 AI 视频大模型都能 4K 飙戏、音画同步已真假难辨,连虚拟数字人…
具身智能(Embodied AI)正在以前所未有的速度和具象化的姿态,成为全球科技界最受瞩目的焦点之一。 从波…