逐字生成非最优?试试逐「块」生成!Block Diffusion打通了自回归与扩散
去年初,OpenAI 的视频生成模型 Sora 带火了扩散模型。 如今,扩散模型被广泛用于生成图像和视频,并在…
去年初,OpenAI 的视频生成模型 Sora 带火了扩散模型。 如今,扩散模型被广泛用于生成图像和视频,并在…
AoT 作者团队来自 MetaGPT 开源社区。第一作者为香港科技大学(广州)的滕枫蔚,通讯作者为 DeepW…
语音恐怖谷是指在语音合成技术中,当 AI 合成语音接近人类的真实语音,但又存在细微的不自然或不完美之处时,会引…
论文第一作者为香港中文大学(深圳)理工学院在读博士生郭永新,指导老师为通讯作者为香港中文大学(深圳)理工学院 …
「压缩即智能」。这并不是一个新想法,著名 AI 研究科学家、OpenAI 与 SSI 联合创始人 Ilya S…
近段时间,推理模型 DeepSeek R1 可说是 AI 领域的头号话题。用过的都知道,该模型在输出最终回答之…
3月12日,北京人形机器人创新中心(国家地方共建具身智能机器人创新中心)在京发布了全球首个“一脑多能”、“一脑…
系列文章目录 3FS系列(一):存储新纪元的开篇——3FS编译调优与部署的工程实践 引言 2月24日,重磅存储…
何恺明又双叒叕发新作了,这次还是与图灵奖得主 Yann LeCun 合作。 这项研究的主题是没有归一化层的 T…
本文来自港科与 MIT 教授团队。本文有两个共同一作:张鉴殊为武汉大学本科四年级,本篇为其在港科大访问期间完成…