扩散LLM推理用上类GRPO强化学习!优于单独SFT,UCLA、Meta新框架d1开源
大语言模型的推理能力,不再是 AR(自回归)的专属。扩散模型现在也能「动脑子」,新框架 d1 让它们学会了解数…
大语言模型的推理能力,不再是 AR(自回归)的专属。扩散模型现在也能「动脑子」,新框架 d1 让它们学会了解数…
近日,上海人工智能实验室(上海 AI 实验室)开源了生成式世界模型 AETHER。该模型全部由合成数据训练而成…
近期,大模型智能体(Agent)的相关话题爆火 —— 不论是 Anthropic 抢先 MCP 范式的快速普及…
当 DeepSeek-R1、OpenAI o1 这样的大型推理模型还在通过增加推理时的计算量提升性能时,加州大…
在 4 月 18 日举办的 2025 英特尔具身智能解决方案推介会上,英特尔正式发布其具身智能大小脑融合方案(…
谷歌 Gemma 3 上线刚刚过去一个月,现在又出新版本了。 该版本经过量化感知训练(Quantization…
在人工智能技术日新月异的今天,语音合成(TTS)领域正经历着一场前所未有的技术革命。最新一代文本转语音系统不仅…
在大规模催化剂筛选中,快速评估催化剂表面与吸附质之间的全局最低吸附能(Global Minimum Adsor…
ICLR 2025 即将启幕,全球顶尖 AI 学者与技术先锋汇聚一堂。 作为新一代信息技术高地的建设者,上海创…
这份工作的魅力之一,就是能第一时间体验到最新、最前沿的大模型。当然,发布初期难免有些社死时刻,但这次,例外。 …