让视觉语言模型像o3一样动手搜索、写代码!Visual ARFT实现多模态智能体能力
在大型推理模型(例如 OpenAI-o3)中,一个关键的发展趋势是让模型具备原生的智能体能力。具体来说,就是让…
在大型推理模型(例如 OpenAI-o3)中,一个关键的发展趋势是让模型具备原生的智能体能力。具体来说,就是让…
随着大语言模型(LLM)能力的快速迭代,传统评估方法已难以满足需求。如何科学评估 LLM 的「心智」特征,例如…
他们都是 Meta 的顶尖人才。 Meta 开源 Llama 模型家族帮助该公司制定了 AI 战略,某种程度上…
本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。游泽彬和聂燊是中国人民大…
好莱坞要完蛋了。 「你大爷永远是你大爷」这句话的含金量还在上升。 上周谷歌举办了一场开发者大会,祭出一堆好东西…
近年来,思维链在大模型训练和推理中愈发重要。近日,西湖大学 MAPLE 实验室齐国君教授团队首次提出扩散式「发…
编辑 | ScienceAI 2025 年 5 月 26 日,复旦大学、上海科学智能研究院联合施普林格·自然(…
编辑丨coisini 包含 1 亿个人类细胞的超大规模数据集什么样?在其上训练出的单细胞基础模型什么样? 单细…
上周五,知名创业公司 Anthropic 正式推出 Claude 4 系列大模型,引发了业内关注。 亚马逊云科…
国产智能体,这次真封神了。 过去这段时间,「智能体」简直杀疯了。 无论是初创公司还是互联网大厂,主流 AI 玩…