优于o1预览版,推理阶段KV缓存缩减一半,LightTransfer降本还能增效
LLM 在生成 long CoT 方面展现出惊人的能力,例如 o1 已能生成长度高达 100K tokens …
LLM 在生成 long CoT 方面展现出惊人的能力,例如 o1 已能生成长度高达 100K tokens …
今日,魔乐社区(Modelers)宣布已上架由阶跃星辰自研的 Step-Video 视频生成和 Step-Au…
编辑丨& 人体内的每一个细胞都包含相同的基因序列,但每个细胞只表达这些基因的一个方面。这些细胞特异性基…
编辑丨& 功能蛋白质组学为癌症机制提供了关键见解,有助于发现新的生物标志物和治疗靶点。为了充分利用他们…
上周五,稚晖君在微博上预告,「下周有好东西发布」。 还没进入「下周」多久,智元机器人的「好东西」揭晓了,还是双…
1. 背景介绍 近年来,大语言模型(LLM) 的快速发展正推动人工智能迈向新的高度。像 DeepSeek-R1…
半个月前,Anthropic 发布了其迄今为止最聪明的 AI 模型 —— Claude 3.7 Sonnet。…
一直以来,AI 领域的研究者都喜欢让模型去挑战那些人类热衷的经典游戏,以此来检验 AI 的「智能程度」。 例如…
随着大模型在长文本处理任务中的应用日益广泛,如何客观且精准地评估其长文本能力已成为一个亟待解决的问题。 传统上…