北大团队发布首篇大语言模型心理测量学系统综述:评估、验证、增强
随着大语言模型(LLM)能力的快速迭代,传统评估方法已难以满足需求。如何科学评估 LLM 的「心智」特征,例如…
随着大语言模型(LLM)能力的快速迭代,传统评估方法已难以满足需求。如何科学评估 LLM 的「心智」特征,例如…
他们都是 Meta 的顶尖人才。 Meta 开源 Llama 模型家族帮助该公司制定了 AI 战略,某种程度上…
本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。游泽彬和聂燊是中国人民大…
好莱坞要完蛋了。 「你大爷永远是你大爷」这句话的含金量还在上升。 上周谷歌举办了一场开发者大会,祭出一堆好东西…
近年来,思维链在大模型训练和推理中愈发重要。近日,西湖大学 MAPLE 实验室齐国君教授团队首次提出扩散式「发…
编辑 | ScienceAI 2025 年 5 月 26 日,复旦大学、上海科学智能研究院联合施普林格·自然(…
编辑丨coisini 包含 1 亿个人类细胞的超大规模数据集什么样?在其上训练出的单细胞基础模型什么样? 单细…
上周五,知名创业公司 Anthropic 正式推出 Claude 4 系列大模型,引发了业内关注。 亚马逊云科…
国产智能体,这次真封神了。 过去这段时间,「智能体」简直杀疯了。 无论是初创公司还是互联网大厂,主流 AI 玩…
别人都在用 X 发帖子,分享新鲜事物,微软副总裁 Nando de Freitas 却有自己的想法:他要在 X…