资讯 – 第 60 页

未分类

刚刚，「欧洲的DeepSeek」发布Mistral 3系列模型，全线回归Apache 2.0

作者 2025年12月3日

刚刚，「欧洲的 DeepSeek」Mistral AI 刚刚发布了新一代的开放模型 Mistral 3 系列模…

未分类

作者 2025年12月3日

在人工智能快速发展的今天,大语言模型已经深入到我们工作和生活的方方面面。然而,如何让AI生成的内容更加可信、可…

未分类

作者 2025年12月2日

12 月 1 日，沙特阿拉伯规模最大的工业科技盛会 Industrial Transformation Sau…

未分类

作者 2025年12月2日

ChatGPT 三周年刚刚过去，Sam Altman 却显得分外焦虑。据 The Information 报…

未分类

作者 2025年12月2日

大模型最广泛的应用如 ChatGPT、Deepseek、千问、豆包、Gemini 等通常会连接互联网进行检索增…

未分类

作者 2025年12月2日

商汤科技正式发布并开源了与南洋理工大学 S-Lab合作研发的全新多模态模型架构 —— NEO，为日日新 Sen…

未分类

作者 2025年12月2日

刚刚，Transformers v5 发布首个 RC（候选）版本 v5.0.0rc0。 GitHub：htt…

未分类

作者 2025年12月2日

今年，文本生成领域迎来了从自回归（Auto-Regressive）向扩散语言模型（Diffusion LM）的…

未分类

作者 2025年12月2日

在机器人和具身智能领域，transformer 模型正变大越来越通用，同时也越来越「重」。我们在渴望 SOT…

未分类

作者 2025年12月2日

在科学与工程实践中，常会遇到计算成本高、评估耗时的函数优化问题，例如复杂机器学习模型的超参数调整或新型材料的设…