打破长视频理解瓶颈:HoPE混合位置编码提升VLM长度泛化能力
李浩然,CMU 机器学习系研究生,研究方向是基础模型的长上下文建模、对齐、以及检索增强生成。 如今的视觉语言模…
李浩然,CMU 机器学习系研究生,研究方向是基础模型的长上下文建模、对齐、以及检索增强生成。 如今的视觉语言模…
再一次,Meta「搜刮」了 OpenAI 的成员。The Information 发布了文章,谈到 Meta …
本文第一作者卫雅珂为中国人民大学四年级博士生,主要研究方向为多模态学习机制、多模态大模型等,师从胡迪副教授。作…
不知大家是否还记得 Roy Lee 这位网红小哥,他曾先后被哈佛大学和哥伦比亚大学开除,之后辍学创办公司,并成…
据路透社等多家媒体报道,一位知情人士称,OpenAI 最近开始租用谷歌的 AI 芯片来支持 ChatGPT 及…
本文第一作者为美国东北大学博士生沈轩,研究方向为高效人工智能,致力于在 GPU、移动端、FPGA 和 ASIC…
Anthropic 最近做了一项相当有趣的研究:让 Claude 管理其办公室的一家自动化商店。Claude …
本文第一作者是西湖大学博士生冯睿骐,通讯作者为西湖大学人工智能系助理教授吴泰霖。吴泰霖实验室专注于解决 AI …
2025年6月27日,思科2025生态创新峰会在上海成功举办。本次峰会以“开启AI新视界”为主题,汇聚众多行业…
作者 | 论文团队 编辑 | ScienceAI Sequence-to-function 模型是一类强大的基…