ETT:打破原生多模态学习视觉瓶颈,重塑视觉tokenizer优化范式
本文由北京智源研究院多模态大模型研究中心(团队负责人王鑫龙,团队代表作 EMU 系列、EVA 系列、Paint…
本文由北京智源研究院多模态大模型研究中心(团队负责人王鑫龙,团队代表作 EMU 系列、EVA 系列、Paint…
“河南郑州二模549分,历史类,一本线517分,推荐一下应该怎么报考”。高考临近,这类问题成为考生和家长搜索查…
编辑丨coisini 电化学领域的假设构建与实验设计主要依赖文献经验和研究者的直觉,其验证过程通常耗费资源且需…
编辑丨% 科学家开发了一种 AI 辅助的仿生复眼相机。 炎炎夏日,相信各位读者都有被蚊子骚扰过的恼火记忆。但往…
大模型越来越聪明,企业却似乎越来越焦虑了。 模型性能突飞猛进,从写文案到搭智能体(Agent),AI 掌握的技…
强化学习 (RL) 显著提升了视觉-语言模型 (VLM) 的推理能力。然而,RL 在推理任务之外的应用,尤其是…
在大型推理模型(例如 OpenAI-o3)中,一个关键的发展趋势是让模型具备原生的智能体能力。具体来说,就是让…
随着大语言模型(LLM)能力的快速迭代,传统评估方法已难以满足需求。如何科学评估 LLM 的「心智」特征,例如…
他们都是 Meta 的顶尖人才。 Meta 开源 Llama 模型家族帮助该公司制定了 AI 战略,某种程度上…
本文介绍的工作由中国人民大学高瓴人工智能学院李崇轩、文继荣教授团队与蚂蚁集团共同完成。游泽彬和聂燊是中国人民大…