DeepSeek用的GRPO有那么特别吗?万字长文分析四篇精品论文
本文详细解读了 Kimi k1.5、OpenReasonerZero、DAPO 和 Dr. GRPO 四篇论文…
本文详细解读了 Kimi k1.5、OpenReasonerZero、DAPO 和 Dr. GRPO 四篇论文…
编辑 | Sia 老铁们,2025 年了。 AI 视频大模型都能 4K 飙戏、音画同步已真假难辨,连虚拟数字人…
具身智能(Embodied AI)正在以前所未有的速度和具象化的姿态,成为全球科技界最受瞩目的焦点之一。 从波…
大语言模型(LLM)已成为规划复杂任务的强大工具。虽然现有方法通常依赖于 “思考 – 行动 …
编辑 | 白菜叶 蛋白质被自然选择折叠成明确定义的天然状态,这一概念已在能量图谱框架内得到有效阐述,这为 Al…
现如今,随着参数规模的指数级增长,大语言模型(LLM)的能力边界不断被打破,AI 的智力正在经历快速跃迁。但随…
2025 年 6 月 6-7 日 中国,北京 这个初夏 四位图灵奖得主 与全球创新力量共赴智源大会 即刻报名,…
论文第一作者林宏彬来自香港中文大学(深圳)理工学院的Deep Bit 实验室、深圳市未来智联网络研究院,导师为…
编辑 | 白菜叶 随着人工智能的快速发展,大型语言模型越来越多地被用于应对各类科学挑战。这里有一个关键步骤:需…
复杂的推理,编程能力都有飞跃,就可以「勒索人类」。 全世界都在等待GPT-5、DeepSeek V4,但从今天…