未分类 – 第 115 页

未分类

DeepSeek的GRPO会导致模型崩溃？看下Qwen3新范式GSPO

作者 2025年8月7日

众所周知，大型语言模型的训练通常分为两个阶段。第一阶段是「预训练」，开发者利用大规模文本数据集训练模型，让它学…

未分类

作者 2025年8月7日

自首次提出 GPT 架构以来，转眼已经过去了七年。如果从 2019 年的 GPT-2 出发，回顾至 2024…

未分类

作者 2025年8月7日

编辑丨coisini 精确的基因组组装（Genome assembly）是生物学研究的基石，但即便是最高质量的…

未分类

作者 2025年8月7日

明天，Grok 对阵 OpenAI 的 o3。谁也没想到，谷歌攒的 Kaggle AI Chess 比赛（即…

未分类

作者 2025年8月7日

本系列工作第一作者张泽宇，中国人民大学博士生，研究方向为大语言模型智能体的记忆机制和个性化；谭浩然，中国人民大…

未分类

作者 2025年8月7日

8月6日，小鹏汽车在北京举办「THE NEXT 全新小鹏P7·中国首秀」发布会，新车正式亮相并开启预订，共发布…

未分类

作者 2025年8月7日

2025年8月6日，北京 —— 傅利叶正式发布首款主打交互陪伴、具备“可触摸”特性的全尺寸人形Care-bot…

未分类

作者 2025年8月6日

一、“具身智能”的含义？具身智能是将人工智能融入机器人等物理实体，赋予其像人一样感知、学习及与环境动态交互能…

未分类

作者 2025年8月6日

基于海量数据训练得到的大语言模型（LLM）表现出强大的推理和解决问题的能力，但也深受海量数据带来的敏感信息（隐…

未分类

作者 2025年8月6日

编辑丨coisini 蛋白质-多肽相互作用在细胞环境中无处不在，并在众多生物过程中发挥关键作用。由于多肽具有…