ACL 2025 | 基于Token预算感知的大模型高效推理技术
本位作者分别来自南京大学,罗格斯大学和马萨诸塞大学阿默斯特分校。第一作者韩廷旭与共同第一作者王震霆是分别来自南…
本位作者分别来自南京大学,罗格斯大学和马萨诸塞大学阿默斯特分校。第一作者韩廷旭与共同第一作者王震霆是分别来自南…
智能体技术日益发展,但现有的许多通用智能体仍然高度依赖于人工预定义好的工具库和工作流,这极大限制了其创造力、可…
本文作者分别来自新加坡国立大学、北京大学与清华大学。第一作者王宇豪与共同第一作者屈文杰来自新加坡国立大学,研究…
想训练属于自己的高性能推理模型,却被同步强化学习(RL)框架的低效率和高门槛劝退?AReaL 全面升级,更快,…
GPT 系列模型的记忆容量约为每个参数 3.6 比特。 语言模型到底能记住多少信息?Meta、DeepMind…
强化学习(RL)到底是语言模型能力进化的「发动机」,还是只是更努力地背题、换个方式答题?这个问题,学界争论已久…
编辑丨% 探索金属有机框架(MOFs)这一庞大且尚未充分利用的化学空间,有望在材料科学领域拓展出一片更广阔的学…
编辑 | 萝卜皮 磷是生命所必需的元素,对海洋生产力来说至关重要。 尽管有地球化学证据表明深海冷泉中存在活跃的…
上个月 21 号,Google I/O 2025 开发者大会可说是吸睛无数,各种 AI 模型、技术、工具、服务…
随着大模型能力持续增强,仅通过观测各个Benchmark上的得分来判断一个模型是否真的聪明、值得信赖,可能远远…