ICML 2025 | 作业帮团队提出基于能量的偏好模型(EBM),攻克LLM对齐痛点,性能超越主流方法
在大模型(LLM)通过人类反馈进行对齐(RLHF)的过程中,核心的偏好建模方法Bradley-Terry模型(…
在大模型(LLM)通过人类反馈进行对齐(RLHF)的过程中,核心的偏好建模方法Bradley-Terry模型(…
一亿美元能买一栋别墅,但买不了梦想? 最近,Meta 内部发生了一些有意思的事情 —— 一边是扎克伯格动辄上亿…
神秘AI模型Nano-Banana火了,冒出一堆假网站,李鬼和李逵傻傻分不清。 最近,AI 社区又冒出一个神秘…
这个先进的 AI 为何会突然对一个汉字「情有独钟」?DeepSeek 最新的 V3.1 模型上线不到一周,就因…
打造更聪明、更全能的社交。 大家都说,在国外,社交应用是 Meta 的天下。 但来自中国的一位小哥偏不信邪,他…
这是老黄给机器人们送上的礼物。 本周一,英伟达正式发布了旗下的新一代机器人专用芯片 Jetson Thor。与…
近日,蚂蚁数科 AIoT 技术团队独立完成的论文《RollingEvidence: Autoregressiv…
编辑丨& 现实里,分子是不断运动的,它们的相遇与结合像是一部动态电影,而这也就为药物研发带来了艰巨的挑…
当地时间周一,马斯克向 OpenAI 和苹果「开炮」了! 据多家外媒报道,马斯克旗下 xAI 一纸讼书,控告它…
本文第一作者是清华大学博士生张清杰,研究方向是大语言模型异常行为和可解释性;本文通讯作者是清华大学邱寒副教授;…