视频生成1.3B碾压14B、图像生成直逼GPT-4o!港科&快手开源测试时扩展新范式
论文第一作者为何浩然,香港科技大学二年级博士,他的研究方向包括强化学习、生成流模型(GFlowNets)以及具…
论文第一作者为何浩然,香港科技大学二年级博士,他的研究方向包括强化学习、生成流模型(GFlowNets)以及具…
今年的苹果,到底有没有新活? 北京时间今天凌晨1点,一年一度的「科技圈春晚」——苹果全球开发者大会WWDC在C…
王劲,香港大学计算机系二年级博士生,导师为罗平老师。研究兴趣包括多模态大模型训练与评测、伪造检测等,有多项工作…
端侧大模型,正在发生质变。 端侧语言模型,终于迎来了脱胎换骨式的创新。 上周五,2025 智源大会上,国内知名…
近期,当很多人还在纠结用什么 label 和 reward 训练大模型的时候,以及纠结用什么样的基准模型进行公…
视觉-语言-动作基础模型(Vision-Language-Action Foundation Models, …
编辑 | 萝卜皮 在药物研发中,识别能够与靶蛋白相互作用的新型药物是一项高难度、高耗时、高成本的任务。 近年来…
编辑 | 白菜叶 想象一下,用普通的笔记本电脑而不是超级计算机来诊断癌症,听起来像科幻小说吗? 东京科学研究所…
你是否注意到,现在的 AI 越来越 “聪明” 了?能写小说、做翻译、甚至帮医生看 CT…
当前,AI 的「推理」能力已经在以 DeepSeek-R1、OpenAI o1/o3、Claude 3.7 S…