边学边练,推理觉醒:LUFFY让强化学习即学即用!
破解 “只学不练” 与 “只练不学” 的难题 想象你准备参加一场高水平的数学竞赛。如果你只是反复背诵往年题目的…
破解 “只学不练” 与 “只练不学” 的难题 想象你准备参加一场高水平的数学竞赛。如果你只是反复背诵往年题目的…
NotebookLM 正在变成谷歌 AI 路线里最靠谱的选手之一:现在除了支持中文播报,还要上移动 App,变…
在 AI 领域里,大模型通常具有百亿甚至数千亿参数,训练和推理过程对计算资源、存储系统和数据访问效率提出了极高…
本文由圣路易斯华盛顿大学与北京大学联合完成,第一作者为圣路易斯华盛顿大学的刘晓一,他在北京大学访问期间完成了该…
本文作者均来自中兴通讯无线研究院「大模型深潜」团队。团队重点攻关方向包括「推理模型构建:蒸馏与强化学习方法」、…
i 人参与大型学术会议,如何在享受人群的同时展开有效社交? 有点难度,但「其实也并非完全不可能」。 「我写了一…
知名 Go 大佬 Thorsten Ball 最近用 315 行代码构建了一个编程智能体,并表示「它运行得非常…
本文由阿里云通义点金团队和苏州大学联合完成。 近日,阿里云通义点金团队与苏州大学携手合作,在金融大语言模型领域…
本文第一作者为密歇根州立大学计算机系博士生张益萌,系 OPTML 实验室成员,指导老师为刘思佳助理教授。研究工…
第 42 届国际机器学习大会(ICML)将于 2025 年 7 月 13 日至 19 日在加拿大温哥华举行。刚…