众所周知视频不能P?北大施柏鑫团队、贝式计算CVPR研究:视频里轻松换衣服、加柯基
视频是信息密度最高、情感表达最丰富的媒介之一,高度还原现实的复杂性与细节。正因如此,视频也是编辑难度最高的一类…
视频是信息密度最高、情感表达最丰富的媒介之一,高度还原现实的复杂性与细节。正因如此,视频也是编辑难度最高的一类…
一块经过 shunt mod 改装的华硕 ROG Astral LC RTX 5090 的性能,超越了售价 1…
第一作者谢云飞是莱斯大学博士生,导师为通讯作者魏晨教授,研究方向包括多模态生成与理解。 Project Lea…
BookWorld由复旦大学冉一婷、王鑫涛主导完成,由阳德青老师、肖仰华老师共同指导。复旦大学知识工场实验室长…
2025年6月23日,千里科技在重庆正式发布了面向 L2+级的智能辅助驾驶解决方案——千里智驾1.0,并公布了…
编辑丨% 生病吃药的时候,常会在说明书上看到对此药副作用的说明。对副作用的识别研究有助于药物开发过程中风险的降…
编辑 | 白菜叶 近期,美国西北大学(Northwestern University)生物物理学家开发了一种新…
最强模型OpenAI-o1准确率不足50%,开源模型“集体翻车”,多模态大模型(MLLM)立体几何数学推理能力…
2025 年已经过半,AI 领域依旧保持着高速发展的势头。从大模型的演化,到多模态系统的融合,再到推理能力与可…
只需要三条轨迹,就能取得 96.8% 的成功率?视觉干扰、任务组合等泛化场景都能轻松拿捏?或许,3D VLA …