1100多个模型殊途同归,指向一个「通用子空间」,柏拉图又赢一回?
模型架构的重要性可能远超我们之前的认知。 最近,约翰斯・霍普金斯大学的一项研究发现:1100 多个不同的神经网…
模型架构的重要性可能远超我们之前的认知。 最近,约翰斯・霍普金斯大学的一项研究发现:1100 多个不同的神经网…
本文第一作者陈羽田,香港中文大学 MMLab 博士二年级在读,研究方向为三维重建与生成,导师为薛天帆教授。个人…
Google 正在加速将其 Gemini 模型的能力融入核心产品线。 Google 周五宣布,正式向 Goog…
8B 模型在数学竞赛任务上超越 GPT-5! 阶跃星辰正式推出并行协同推理(PaCoRe, Parallel …
国际计算语言学学会(ACL)正式公布了 2025 年度的会士(ACL Fellows) 名单。 作为自然语言处…
本文第一作者是二年级博士生闫熠辰,主要研究方向是多模态大模型的数据质量管理;通讯作者是李环研究员,主要研究方向…
网友吐槽GPT-5.2「不通人性」。 X 上充斥着对 GPT-5.2 的恶评。 昨天,OpenAI 十周年之际…
邹忌曾经有一个问题:吾与徐公孰美? 而对于 REPA,也有一个类似的问题:全局信息与空间结构,哪个对表征对齐更…
多语言大模型(MLLM)在面对多语言任务时,往往面临一个选择难题:是用原来的语言直接回答,还是翻译成高资源语言…
扩散语言模型(Diffusion Language Models)以其独特的 “全局规划” 与并行解码能力广为…