CVPR 2025 | CV 微调卷出天际,Mona:我小、我强、我省资源
合作单位包括清华、国科大、上海交大、阿里巴巴。本文第一作者为殷东硕,清华大学计算机系「水木学者」博后,中科院博…
合作单位包括清华、国科大、上海交大、阿里巴巴。本文第一作者为殷东硕,清华大学计算机系「水木学者」博后,中科院博…
现如今,微调和强化学习等后训练技术已经成为提升 LLM 能力的重要关键。 近日,一份围绕 LLM 后训练的综述…
编辑 | ScienceAI 4月29日,中国科学院自动化研究所(以下简称“自动化所”)在第八届数字中国建设峰…
一种基于扩散模型的生成式 ML 框架 PXRDnet 解决材料难题。 在材料领域有一个长期存在的问题,它致使救…
想象一下,你的智能体只需接收一条自然语言指令,就能在 600+ 工具中自动筛选出最合适的 API 组合来完成整…
昨晚,奥特曼在 X 上发了条帖子,大意是由于发现 GPT-4o 「过度谄媚」的问题,所以从周一晚上开始回滚 G…
在人工智能领域,语言模型的发展日新月异,推理能力作为语言模型的核心竞争力之一,一直是研究的焦点,许多的 AI …
论文作者包括来自上海交通大学的杨滢轩、柴化灿、宋源祎、齐思远、温睦宁、李宁、廖俊威、胡浩毅、林江浩、刘卫文、温…
李武军教授为通讯作者,硕士生林昊(已毕业,现工作于阿里巴巴)、吴轲、李杰为共同第一作者,博士生李俊为参与作者。…
今早一睁眼,朋友圈就被 Qwen3 刷屏了。 这次阿里一口气开源了 8 款大模型,其中两款 MoE 模型以及六…