跳到内容
HiFUNAI
  • 首页
  • 资讯
  • AI导航
  • 联系我们
  • 关于我们
  • 专业服务
HiFUNAI

未分类

ICLR 2025 Oral|差分注意力机制引领变革,DIFF Transformer攻克长序列建模难题
未分类

ICLR 2025 Oral|差分注意力机制引领变革,DIFF Transformer攻克长序列建模难题

作者 2025年4月28日

近年来,Transformer 架构在自然语言处理领域取得了巨大成功,从机器翻译到文本生成,其强大的建模能力为…

阅读更多 ICLR 2025 Oral|差分注意力机制引领变革,DIFF Transformer攻克长序列建模难题继续

ICLR 2025 | 大模型是否能做到有效“遗忘”?从梯度视角重新审视LLM反学习方法
未分类

ICLR 2025 | 大模型是否能做到有效“遗忘”?从梯度视角重新审视LLM反学习方法

作者 2025年4月28日

大型语言模型(LLM)通过海量数据训练获得强大能力,但也可能记忆敏感信息(如隐私数据、版权内容),引发法律和伦…

阅读更多 ICLR 2025 | 大模型是否能做到有效“遗忘”?从梯度视角重新审视LLM反学习方法继续

ICLR 2025 | 基于多任务学习的回归范式实现更快的灵活分子对接
未分类

ICLR 2025 | 基于多任务学习的回归范式实现更快的灵活分子对接

作者 2025年4月28日

引言 分子对接(Molecular Docking)是用于预测小分子(Ligand)如何与目标蛋白质(Prot…

阅读更多 ICLR 2025 | 基于多任务学习的回归范式实现更快的灵活分子对接继续

智象未来x商汤大装置:全栈赋能全球首个开放使用视频生成DiT模型
未分类

智象未来x商汤大装置:全栈赋能全球首个开放使用视频生成DiT模型

作者 2025年4月28日

“连续4周千卡不间断训练、2个月完成模型迭代,先于Sora半年开放使用……” 2024年初,Sora的惊艳亮相…

阅读更多 智象未来x商汤大装置:全栈赋能全球首个开放使用视频生成DiT模型继续

两篇Nature Medicine,DeepSeek、GPT-4o等LLM在医学推理、临床决策中的应用评估
未分类

两篇Nature Medicine,DeepSeek、GPT-4o等LLM在医学推理、临床决策中的应用评估

作者 2025年4月28日

大型语言模型 (LLM) 正在日益改变医疗应用。 然而,像 GPT-4o 这样的专有模型在临床应用方面面临巨大…

阅读更多 两篇Nature Medicine,DeepSeek、GPT-4o等LLM在医学推理、临床决策中的应用评估继续

AI+量子计算:港科大等提出突破性低温存内计算方案
未分类

AI+量子计算:港科大等提出突破性低温存内计算方案

作者 2025年4月28日

人工智能(AI)的迅速发展带来了算力需求的激增。量子计算一直被普遍认为具有高速、高效的优势,因此量子计算在 A…

阅读更多 AI+量子计算:港科大等提出突破性低温存内计算方案继续

除了Ilya、Karpathy,离职OpenAI的大牛们,竟然创立了这么多公司
未分类

除了Ilya、Karpathy,离职OpenAI的大牛们,竟然创立了这么多公司

作者 2025年4月28日

聚是一团火,散是满天星。 硅谷新势力已经崛起,这些创业者来自 OpenAI。 作为 ChatGPT 的缔造者,…

阅读更多 除了Ilya、Karpathy,离职OpenAI的大牛们,竟然创立了这么多公司继续

字节Seed团队PHD-Transformer突破预训练长度扩展!破解KV缓存膨胀难题
未分类

字节Seed团队PHD-Transformer突破预训练长度扩展!破解KV缓存膨胀难题

作者 2025年4月28日

最近,DeepSeek-R1 和 OpenAI o1/03 等推理大模型在后训练阶段探索了长度扩展(lengt…

阅读更多 字节Seed团队PHD-Transformer突破预训练长度扩展!破解KV缓存膨胀难题继续

首个系统性工具使用奖励范式,ToolRL刷新大模型训练思路
未分类

首个系统性工具使用奖励范式,ToolRL刷新大模型训练思路

作者 2025年4月28日

钱成目前是伊利诺伊大学香槟分校 (UIUC) 一年级博士生,导师为季姮教授。本科就读于清华大学,导师为刘知远教…

阅读更多 首个系统性工具使用奖励范式,ToolRL刷新大模型训练思路继续

模型压缩到70%,还能保持100%准确率,无损压缩框架DFloat11来了
未分类

模型压缩到70%,还能保持100%准确率,无损压缩框架DFloat11来了

作者 2025年4月28日

大型语言模型(LLMs)在广泛的自然语言处理(NLP)任务中展现出了卓越的能力。然而,它们迅速增长的规模给高效…

阅读更多 模型压缩到70%,还能保持100%准确率,无损压缩框架DFloat11来了继续

页面导航

上一页上一页 1 … 55 56 57 58 59 … 184 下一页下一页

© 2025 HiFUNAI 沪ICP备2024096238号-3

  • 首页
  • 资讯
  • AI导航
  • 联系我们
  • 关于我们
  • 专业服务