视觉SSL终于追上了CLIP!Yann LeCun、谢赛宁等新作,逆转VQA任务固有认知
扩展无语言的视觉表征学习。 在视觉问题解答(VQA)等多模态环境中,当前视觉自监督学习(SSL)的表现还比不上…
扩展无语言的视觉表征学习。 在视觉问题解答(VQA)等多模态环境中,当前视觉自监督学习(SSL)的表现还比不上…
论文一作李靖瑶,香港中文大学博士生(DV Lab),师从贾佳亚教授。主要研究方向是大语言模型,包括模型预训练、…
编辑 | 杨文 这波 GPT-4o 的「吉卜力」狂欢,让 OpenAI 大赚了一笔。 昨天,Sam Altma…
2025 年,生成式 AI 的发展速度正在加快。 我们见证了 DeepSeek R1,用强大的推理能力再次点燃…
当 AI 翻开奥数题,CPU 也烧了! 还记得那些被奥数题折磨得彻夜难眠的日子吗? 当你在凌晨三点对着一道几何…
无法说话的人,现在可以通过大脑扫描的方式实时地用自己的声音说话了。整个过程没有延迟,也不需要打字,不用发出任何…
白泽琛,新加坡国立大学 Show Lab 博士生,他的研究方向主要包括视频理解和统一的多模态模型,在 CVPR…
近日,全球领先的无线泳池机器人公司元鼎智能宣布完成新一轮近 10 亿人民币的战略融资。本轮融资由全球泳池行业巨…
编辑 | 白菜叶 纳米颗粒引起的慢性损伤(例如纤维化和致癌作用)引起了公众健康担忧,需要在危害识别中迅速评估。…
编辑丨& 结合蛋白通过与特定分子(如 DNA、RNA 或肽)选择性相互作用来调节各种细胞过程,它们能以…