8B模型可以超过GPT-4o!并行KV Cache压缩支持的128K长度外推方法ParallelComp
作者熊璟,香港大学一年级博士生,师从黄毅教授和孔令鹏教授。已在 ICLR、ICML、NeurIPS、ACL、E…
作者熊璟,香港大学一年级博士生,师从黄毅教授和孔令鹏教授。已在 ICLR、ICML、NeurIPS、ACL、E…
当前,多模态大模型在根据复杂文本提示生成高保真、语义一致的图像方面取得了显著进展,但在处理包含精确空间关系、多…
6 月 19 日,亚马逊云科技中国峰会在上海召开。 峰会期间,亚马逊全球副总裁、亚马逊云科技大中华区总裁储瑞松…
编辑 | 萝卜皮 生物医学研究是我们进行人类健康研究、疾病治疗、药物研发以及促进临床护理进步的基石。 然而,随…
过去几年,随着基于人类偏好的强化学习(Reinforcement Learning from Human Fe…
AI 时代,你可能听说过提示词工程、RAG、记忆等术语。但是很少有人提及上下文工程(context engin…
本工作共同第一作者包括:张亦弛,清华大学计算机系三年级博士生,师从朱军教授,研究方向是多模态大模型和大模型安全…
「卖铲人」华为给具身智能出了另一种解法。 华为开发者大会 2025(HDC 2025)上发布了 CloudRo…
今天,Gemini 家族迎来了一个新成员:Gemini Robotics On-Device。 这是谷歌 De…
TaoAvatar 是由阿里巴巴淘宝 Meta 技术团队研发的 3D 真人数字人技术,这一技术能在手机或 XR…