大模型量化训练极限在哪?腾讯混元提出低比特浮点数训练Scaling Laws
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,…
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,…
我们已经迎来了端侧 GPT-4o 时刻? 本周,面壁智能宣布新一代端侧模型开源,先在外网机器学习社区引起了人们…
1月16日,阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM,72B及7B尺寸模型性能…
编辑 | 2049 随着唐纳德·特朗普(Donald Trump)准备开启其第二任美国总统任期,科学界正呈现出…
编辑 | ScienceAI 小分子力场是药物发现中的重要工具,在计算机辅助药物设计中发挥关键作用。化学空间覆…
AI好好用报道 编辑:佳琪 钻戒保值?不,现在流行买智能戒指保健康。 奢侈品这么拥挤的赛道,智能戒指也是挤进…
正如论文一作所说,「新架构 Titans 既比 Transformer 和现代线性 RNN 更有效,也比 GP…
1月15日,京西集团举办了MagneRide®磁流变悬架国产化发布会,并正式发布《磁流变元年宣言》。作为唯一具…
编辑 | ScienceAI 当医生面对复杂病例时,往往需要反复思考、权衡多种可能性,才能得出准确诊断。以鉴别…
编辑 | ScienceAI 这是全球首个支持全天候灾害响应的多模态超高分辨率数据集,论文和数据集已公开,作者…