ICML 2025放榜!接收率26.9%,高分被拒,低分录用惹争议
第 42 届国际机器学习大会(ICML)将于 2025 年 7 月 13 日至 19 日在加拿大温哥华举行。刚…
第 42 届国际机器学习大会(ICML)将于 2025 年 7 月 13 日至 19 日在加拿大温哥华举行。刚…
LoRA 中到底存在多少参数冗余?这篇创新研究介绍了 LoRI 技术,它证明即使大幅减少 LoRA 的可训练参…
当前,多模态大模型驱动的图形用户界面(GUI)智能体在自动化手机、电脑操作方面展现出巨大潜力。然而,一些现有智…
推理模型发展正盛,著名 AI 技术博主 Sebastian Raschka 也正在写一本关于推理模型工作方式的…
DeepSeek R2 的前奏? 五一劳动节到了,DeepSeek 的新消息可没停下来。 前些天到处都在流传着…
这篇论文包含了当前 LLM 的许多要素,十年后的今天或许仍值得一读。 发布于 2017 年的 Transfor…
合作单位包括清华、国科大、上海交大、阿里巴巴。本文第一作者为殷东硕,清华大学计算机系「水木学者」博后,中科院博…
现如今,微调和强化学习等后训练技术已经成为提升 LLM 能力的重要关键。 近日,一份围绕 LLM 后训练的综述…
编辑 | ScienceAI 4月29日,中国科学院自动化研究所(以下简称“自动化所”)在第八届数字中国建设峰…
一种基于扩散模型的生成式 ML 框架 PXRDnet 解决材料难题。 在材料领域有一个长期存在的问题,它致使救…