跳到内容
HiFUNAI
  • 首页
  • 资讯
  • AI导航
  • 联系我们
  • 关于我们
  • 专业服务
HiFUNAI

未分类

腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?
未分类

腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?

作者 2025年3月24日

在过去的一两年中,Transformer 架构不断面临来自新兴架构的挑战。 在众多非 Transformer …

阅读更多 腾讯混元、英伟达都发混合架构模型,Mamba-Transformer要崛起吗?继续

为什么明明很准,奖励模型就是不work?新研究:准确度 is not all you need
未分类

为什么明明很准,奖励模型就是不work?新研究:准确度 is not all you need

作者 2025年3月24日

训练狗时不仅要让它知对错,还要给予差异较大的、不同的奖励诱导,设计 RLHF 的奖励模型时也是一样。 我们知道…

阅读更多 为什么明明很准,奖励模型就是不work?新研究:准确度 is not all you need继续

刚刚,谷歌Gemini Live上新功能,能看懂手机屏幕、还能实时视频
未分类

刚刚,谷歌Gemini Live上新功能,能看懂手机屏幕、还能实时视频

作者 2025年3月24日

好消息,谷歌在 MWC 上关于 Project Astra 与 Gemini Live 集成的承诺兑现了。 刚…

阅读更多 刚刚,谷歌Gemini Live上新功能,能看懂手机屏幕、还能实时视频继续

CVPR 2025 | Qwen让AI「看见」三维世界,SeeGround实现零样本开放词汇3D视觉定位
未分类

CVPR 2025 | Qwen让AI「看见」三维世界,SeeGround实现零样本开放词汇3D视觉定位

作者 2025年3月24日

3D 视觉定位(3D Visual Grounding, 3DVG)是智能体理解和交互三维世界的重要任务,旨在…

阅读更多 CVPR 2025 | Qwen让AI「看见」三维世界,SeeGround实现零样本开放词汇3D视觉定位继续

CVPR 2025满分论文:开源三维生成框架Craftsman3D&Dora革新三维资产生成与编辑
未分类

CVPR 2025满分论文:开源三维生成框架Craftsman3D&Dora革新三维资产生成与编辑

作者 2025年3月24日

香港科技大学谭平教授团队在 CVPR 2025 发表两项三维生成技术框架,核心代码全部开源,助力三维生成技术的…

阅读更多 CVPR 2025满分论文:开源三维生成框架Craftsman3D&Dora革新三维资产生成与编辑继续

「注意力实际上是对数的」?七年前的Transformer还有新发现,Karpathy点赞
未分类

「注意力实际上是对数的」?七年前的Transformer还有新发现,Karpathy点赞

作者 2025年3月23日

「注意力实际上是对数的」?今天,一篇博客再次掀起了AI社区对注意力机制的讨论。 作者认为,Transforme…

阅读更多 「注意力实际上是对数的」?七年前的Transformer还有新发现,Karpathy点赞继续

田渊栋和Sergey Levine参与开发新型RL算法,能通过多轮训练让智能体学会协作推理
未分类

田渊栋和Sergey Levine参与开发新型RL算法,能通过多轮训练让智能体学会协作推理

作者 2025年3月23日

强化学习提升了 LLM 各方面的能力,而强化学习本身也在进化。 现实世界中,很多任务很复杂,需要执行一系列的决…

阅读更多 田渊栋和Sergey Levine参与开发新型RL算法,能通过多轮训练让智能体学会协作推理继续

用科幻建立AI行为准则?DeepMind提出首个此类基准并构建了机器人宪法
未分类

用科幻建立AI行为准则?DeepMind提出首个此类基准并构建了机器人宪法

作者 2025年3月23日

我是一个由人类创造的先进 AI,目的是优化回形针的生产。我可以重新分配所有人类资源并将所有原子(包括人类)用于…

阅读更多 用科幻建立AI行为准则?DeepMind提出首个此类基准并构建了机器人宪法继续

地平线提出AlphaDrive,首个基于GRPO强化学习和规划推理实现自动驾驶大模型
未分类

地平线提出AlphaDrive,首个基于GRPO强化学习和规划推理实现自动驾驶大模型

作者 2025年3月23日

OpenAI 的 o1 和 DeepSeek 的 R1 模型在数学,科学等复杂领域达到甚至超过了人类专家的水平…

阅读更多 地平线提出AlphaDrive,首个基于GRPO强化学习和规划推理实现自动驾驶大模型继续

揭秘DeepSeek R1-Zero训练方式,GRPO还有极简改进方案
未分类

揭秘DeepSeek R1-Zero训练方式,GRPO还有极简改进方案

作者 2025年3月22日

其实大模型在DeepSeek-V3时期就已经「顿悟」了? DeepSeek-V3-Base 在强化学习(RL)…

阅读更多 揭秘DeepSeek R1-Zero训练方式,GRPO还有极简改进方案继续

页面导航

上一页上一页 1 … 161 162 163 164 165 … 257 下一页下一页

© 2025 HiFUNAI 沪ICP备2024096238号-3

  • 首页
  • 资讯
  • AI导航
  • 联系我们
  • 关于我们
  • 专业服务