时空压缩!剑桥大学提出注意力机制MTLA:推理加速5倍,显存减至1/8
在大语言模型蓬勃发展的背景下,Transformer 架构依然是不可替代的核心组件。尽管其自注意力机制存在计算…
在大语言模型蓬勃发展的背景下,Transformer 架构依然是不可替代的核心组件。尽管其自注意力机制存在计算…
AI挑战全套高考数学题来了! 话接上回。高考数学一结束,我们连夜使用六款大模型产品,按照一般用户截图提问的方式…
本文介绍了一种名为「嫁接」的技术,用于在小计算预算下通过编辑预训练 Diffusion Transformer…
本工作来自北京大学智能学院贺笛老师课题组与蚂蚁集团武威团队。贺笛老师在机器学习领域获得过多项荣誉,包括 ICL…
在构建通用人工智能、世界模型、具身智能等关键技术的竞赛中,一个能力正变得愈发核心 —— 高质量的 3D 场景生…
北京时间6月10日凌晨,淘宝在苹果开发者大会(WWDC)现场,捧起被誉为应用界“奥斯卡”的苹果设计大奖,成为该…
编辑 | 萝卜皮 自驱动实验室 (SDL) 由机器人技术、自动化和人工智能驱动,通过自主实验加速科学发现。然而…
编辑 | ScienceAI 本文作者分别来自清华大学、人民大学高瓴人工智能学院,和字节跳动 AI 制药团队。…
为什么语言模型很成功,视频模型还是那么弱? 「我一直很困惑,语言模型怎么能从下一个 token 预测中学到这么…
游戏直播等实时渲染门槛要被击穿了?Adobe 的一项新研究带来新的可能。 近年来,视频合成技术已经取得了显著突…