3B模型长思考后击败70B!HuggingFace逆向出o1背后技术细节并开源
如果给小模型更长的思考时间,它们性能可以超越更大规模的模型。 最近一段时间,业内对小模型的研究热情空前地高涨,…
如果给小模型更长的思考时间,它们性能可以超越更大规模的模型。 最近一段时间,业内对小模型的研究热情空前地高涨,…
视频生成领先 OpenAI 了? 今天是个好日子,至少谷歌这么想。几个小时前,该公司一键三连,一口气发布了两款…
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,…
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,…
编辑丨ScienceAI 随着电动汽车市场的快速发展,动力电池需求量激增,但其设计寿命有限,退役潮已经到来。如…
ScienceAI原创 作者:萝卜皮 近年来人工智能(AI)等新兴技术的突破,正在逐渐改变科学研究的模式。 今…
BLT 在许多基准测试中超越了基于 token 的架构。 最近几天,来自 Meta 、芝加哥大学等机构的合著论…
用强化学习,改变大模型技术范式。 国产大模型,正在引领 AI 技术新方向。 今天上午,月之暗面 Kimi 正式…
这几天,学术圈的小伙伴肯定都很关注正在加拿大温哥华举办的机器学习顶会——NeurIPS 2024。本届会议于今…
12 月 12 日,由中国人工智能产业发展联盟(AIIA)指导、北京中关村科金技术有限公司主办的【2024 大…