「Next-Token」范式改变!刚刚,强化学习预训练来了
谁说强化学习只能是蛋糕上的樱桃,说不定,它也可以是整个蛋糕呢? 在 2016 年的一次演讲中,Yann LeC…
谁说强化学习只能是蛋糕上的樱桃,说不定,它也可以是整个蛋糕呢? 在 2016 年的一次演讲中,Yann LeC…
强推理终于要卷速度了。 大模型强烈刺激,又令人兴奋的重量级玩家。 本周二,欧洲人工智能公司 Mistral A…
本文将介绍 DeepMath-103K 数据集。该工作由腾讯 AI Lab 与上海交通大学团队共同完成。 本文…
第一作者陈昌和是美国密歇根大学的研究生,师从 Nima Fazeli 教授,研究方向包括基础模型、机器人学习与…
今天凌晨一点,OpenAI 宣布:OpenAI o3-pro today. 前沿模型的轮流更新这一次轮到 Op…
在大语言模型蓬勃发展的背景下,Transformer 架构依然是不可替代的核心组件。尽管其自注意力机制存在计算…
AI挑战全套高考数学题来了! 话接上回。高考数学一结束,我们连夜使用六款大模型产品,按照一般用户截图提问的方式…
本文介绍了一种名为「嫁接」的技术,用于在小计算预算下通过编辑预训练 Diffusion Transformer…
本工作来自北京大学智能学院贺笛老师课题组与蚂蚁集团武威团队。贺笛老师在机器学习领域获得过多项荣誉,包括 ICL…
在构建通用人工智能、世界模型、具身智能等关键技术的竞赛中,一个能力正变得愈发核心 —— 高质量的 3D 场景生…