扩散语言模型扛把子LLaDA迎来新版本,数学、代码、对齐能力均提升
本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。朱峰琪、王榕甄、聂燊是中…
本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。朱峰琪、王榕甄、聂燊是中…
本文作者分别来自西安交通大学、马萨诸塞大学阿默斯特分校、武汉大学以及南洋理工大学。第一作者张笑宇是来自西安交通…
随着AI应用爆发,数据库作为底层设施正加速与上层AI生态的融合。近日获悉,OceanBase在AI生态领域取得…
AI 开始从理解文字,全面进化到建模世界、操控实体、模拟大脑、解构分子。 一晃 2025 年已经快要过半了!A…
DeepSeek-R1 爆火后,类 R1 的结果奖励训练范式在各领域掀起了推理热潮。基于规则的结果奖励实现简单…
做海报有多痛苦? 大家做学术应该都懂那种感觉:临近 DDL 前熬夜赶制海报,得把上万字的论文浓缩进一页 PPT…
字节跳动 Seed 团队近期在 arXiv 上发表的论文得到了 ViT 作者,前 Google Brain 最…
星尘智能Astribot S1具身智能机器人迎宾招手 6月6日,国内具身智能机器人先锋企业星尘智能…
在通往通用人工智能(AGI)的进程中,混合专家(MoE)模型凭借动态稀疏计算优势,成为大模型推理提效的关键路径…
作为 AI 领域顶级会议,今年的 CVPR 大会将于 6 月 11 日在美国纳什维尔开幕,想必很多从业者将前往…