DeepSeek的MLA,任意大模型都能轻松迁移了
复旦 NLP 实验室博士后纪焘是这篇文章的第一作者,研究方向为大模型高效推理、多模态大模型,近期代表工作为首个…
复旦 NLP 实验室博士后纪焘是这篇文章的第一作者,研究方向为大模型高效推理、多模态大模型,近期代表工作为首个…
事物都有多面性,正如水,既能载舟,亦能覆舟,还能煮粥。强化学习也是如此。它既能帮助 AlphaGo 击败顶级围…
论文标题:A Survey on LLM Complex Reasoning through the Lens…
2025 年开年,DeepSeek R1 和 V3 重磅发布,其超强的语言建模与推理能力,引爆了全球 AI 社…
AI好好用报道 编辑:杨文 一手实测。 腾讯打了场「闪电战」。 3 月 3 日,腾讯元宝反超 DeepSee…
编辑 | 萝卜皮 机器学习 (ML) 正在改变计算蛋白质设计的世界,数据驱动方法在实验成功率方面超越了基于生物…
BGE 系列模型自发布以来广受社区好评。近日,智源研究院联合多所高校开发了多模态向量模型 BGE-VL,进一步…
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,…
AI好好用报道 机器之心编辑部 基准测试更是全方位超越OpenAI的同类智能体产品Deep Research…
编辑 | 2049 在聚变能源研究领域,等离子体动力学模拟扮演着关键角色。然而,非线性 Fokker-Plan…