什么都不做就能得分?智能体基准测试出现大问题
都在研究考生,考卷出问题了。 基准测试在评估人工智能系统的优势与局限性方面具有基础性作用,是引导科研与产业发展…
都在研究考生,考卷出问题了。 基准测试在评估人工智能系统的优势与局限性方面具有基础性作用,是引导科研与产业发展…
本文作者来自:南京大学、香港大学、中南大学、地平线、中国科学院计算所、上海交通大学、慕尼黑工业大学、清华大学。…
上海交通大学教授、上海人工智能实验室双聘研究员翟广涛认为,完美的 AI 评测体系本身就等同于通用人工智能。 人…
曾经被称为「开源之光」的 Meta,之后可能也要走闭源路线了。 据知情人士透露,Meta 新成立的超级智能实验…
本文的第一作者Yu Wang来自加州大学圣地亚哥分校,主要研究方向为Memory for LLMs and M…
事情真是在不停的反转中。 刚刚,编程助手公司 Cognition 宣布将收购 Windsurf 剩余的员工和资…
Zeju Qiu和Tim Z. Xiao是德国马普所博士生,Simon Buchholz和Maximilian…
又一项中国的 AI 技术在国外火了! 近日,海外社交媒体平台 X 上众多关注 AI 的博主对一个来自中国的新技…
近日,智源研究院发布具身大脑 RoboBrain 2.0 32B 版本以及跨本体大小脑协同框架 RoboOS …
本文的主要作者来自清华大学智能视觉实验室(i-Vision Group)、腾讯混元 X 组。本文的共同第一作者…