斯坦福2025 AI Index报告来了:DeepSeek在全文中被提到45次
刚刚,斯坦福大学正式发布了《2025 AI Index》报告。 在过去的一段时间里,人工智能领域经历了一场蓬勃…
刚刚,斯坦福大学正式发布了《2025 AI Index》报告。 在过去的一段时间里,人工智能领域经历了一场蓬勃…
图文大模型通常采用「预训练 + 监督微调」的两阶段范式进行训练,以强化其指令跟随能力。受语言领域的启发,多模态…
在信息检索系统中,搜索引擎的能力只是影响结果的一个方面,真正的瓶颈往往在于:用户的原始 query 本身不够好…
Q-Insight不再简单地让模型拟合人眼打分,而是将评分视作一种引导信号,促使模型深度思考图像质量的本质原因…
「未来,99% 的 attention 将是大模型 attention,而不是人类 attention。」这是…
Noprop:没有反向传播或前向传播,也能训练神经网络。 「我们应该抛弃反向传播并重新开始。」早在几年前,使反…
本文由加拿大滑铁卢大学魏聪、陈文虎教授团队与 Meta GenAI 共同完成。第一作者魏聪为加拿大滑铁卢大学计…
基于当前观察,预测铰链物体的的运动,尤其是 part-level 级别的运动,是实现世界模型的关键一步。尽管现…
Meta 翻车来得猝不及防。 上周六,Meta 发布了最新 AI 模型系列 ——Llama 4,并一口气出了三…
近年来,基于大语言模型(LLM)的多模态任务处理能力取得了显著进展,特别是在将视觉信息融入语言模型方面。像 Q…