资讯 – 第 141 页

未分类

用动作分块突破RL极限，伯克利引入模仿学习，超越离线/在线SOTA

作者 2025年7月14日

如今，强化学习（Reinforcement Learning，RL）在多个领域已取得显著成果。在实际应用中，…

未分类

作者 2025年7月14日

本文第一作者是张清杰，清华大学博士生，研究方向是大语言模型异常行为和可解释性；本文通讯作者是清华大学邱寒副教授…

未分类

作者 2025年7月14日

本论文核心团队来自北京通用人工智能研究院机器学习实验室，团队负责人李庆博士长期从事多模态理解、多模态智能体、具…

未分类

作者 2025年7月14日

请想象…… 一个 AI—— 它要完整看完一场几十分钟的世界杯决赛，不只是数球门数，更要跨越上百个镜头的线索、情…

未分类

作者 2025年7月14日

编辑 | 白菜叶根据近期推出的基准测试平台，o3 是由 ChatGPT 的创建者开发的人工智能 (AI) 模…

未分类

作者 2025年7月13日

随着大模型的崛起，AI编程领域正在发生翻天覆地的变化。各种编程大模型、编程工具涌现，通过自动补全代码、自动 …

未分类

作者 2025年7月13日

流体力学融入生成式 AI ，构建了一种非常简洁、优雅的形态。众所周知，第 42 届国际机器学习大会（ICML…

未分类

作者 2025年7月13日

本文第一作者为香港科技大学（广州）机器人系一年级博士生宋文轩，主要研究方向为VLA模型，共同第一作者是来自香港…

未分类

作者 2025年7月12日

AI 终于可以当「第一作者」了。在 AI 已深度介入科研流程的今天，从提出假设到生成图表、撰写论文，它正逐步…

未分类

作者 2025年7月12日

随着 OpenAI 推出 GPT-4o 的图像生成功能，AI 生图能力被拉上了一个新的高度，但你有没有想过，这…