阿里云通义点金发布DianJin-R1金融领域推理大模型,32B模型荣膺榜首
本文由阿里云通义点金团队和苏州大学联合完成。 近日,阿里云通义点金团队与苏州大学携手合作,在金融大语言模型领域…
本文由阿里云通义点金团队和苏州大学联合完成。 近日,阿里云通义点金团队与苏州大学携手合作,在金融大语言模型领域…
本文第一作者为密歇根州立大学计算机系博士生张益萌,系 OPTML 实验室成员,指导老师为刘思佳助理教授。研究工…
第 42 届国际机器学习大会(ICML)将于 2025 年 7 月 13 日至 19 日在加拿大温哥华举行。刚…
LoRA 中到底存在多少参数冗余?这篇创新研究介绍了 LoRI 技术,它证明即使大幅减少 LoRA 的可训练参…
当前,多模态大模型驱动的图形用户界面(GUI)智能体在自动化手机、电脑操作方面展现出巨大潜力。然而,一些现有智…
推理模型发展正盛,著名 AI 技术博主 Sebastian Raschka 也正在写一本关于推理模型工作方式的…
DeepSeek R2 的前奏? 五一劳动节到了,DeepSeek 的新消息可没停下来。 前些天到处都在流传着…
这篇论文包含了当前 LLM 的许多要素,十年后的今天或许仍值得一读。 发布于 2017 年的 Transfor…
合作单位包括清华、国科大、上海交大、阿里巴巴。本文第一作者为殷东硕,清华大学计算机系「水木学者」博后,中科院博…
现如今,微调和强化学习等后训练技术已经成为提升 LLM 能力的重要关键。 近日,一份围绕 LLM 后训练的综述…