为DeepSeek MoE模型带来「免费午餐」加速,专家链可大幅提升LLM的信息处理能力
我们都知道,DeepSeek-R1 的训练过程使用了一种名为专家混合模型(Mixture-of-Experts…
我们都知道,DeepSeek-R1 的训练过程使用了一种名为专家混合模型(Mixture-of-Experts…
编辑 | 白菜叶 在 HIMSS 2025 上,微软团队宣布推出了 Microsoft Dragon Copi…
编辑 | ScienceAI 上周,美国斯坦福大学、英伟达等机构联合发布的生物学AI模型Evo2引起广泛关注,…
AI好好用报道 编辑:杨文 啃了10亿+篇小红书、还接入DeepSeek的AI搜索神器「点点」实力如何? 周…
在 DeepSeek 生成的文本中,有 74.2% 的文本在风格上与 OpenAI 模型具有惊人的相似性?这是…
故事始于 2003 年,一位名叫 Britta Späthen 的德国研究生首次接触到了麦凯猜想(McKay …
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,…
课题组长简介 张海仓,上海交通大学医学院研究员、实验室PI。博士毕业于中国科学院计算技术研究所计算机专业,曾先…
编辑 | 萝卜皮 将功能性磁共振成像 (fMRI) 信号解码为文本一直是神经科学界面临的一项重大挑战,它有望推…
编辑 | ScienceAI 近期,上海交通大学医学院张海仓课题组联合中原人工智能产业技术研究院与中国科学院计…