微软诞生50周年,比尔・盖茨撰文忆往昔,并发布了Altair BASIC源代码
1975 年 4 月 4 日,比尔・盖茨和保罗・艾伦在美国新墨西哥州阿尔伯克基市创立了微软公司。到今天,半个世…
1975 年 4 月 4 日,比尔・盖茨和保罗・艾伦在美国新墨西哥州阿尔伯克基市创立了微软公司。到今天,半个世…
近年来,大语言模型(LLM)的性能提升逐渐从训练时规模扩展转向推理阶段的优化,这一趋势催生了「测试时扩展(te…
想象一下,一座生机勃勃的 3D 城市在你眼前瞬间成型 —— 没有漫长的计算,没有庞大的存储需求,只有极速的生成…
「下一代默认 AI 大模型工具」的竞争开始了。 本周五凌晨,OpenAI CEO 山姆・奥特曼宣布了一个令人兴…
Attention 还在卷自己。 当上下文包含大量 Token 时,如何在忽略干扰因素的同时关注到相关部分,是…
这会是 DeepSeek R2 的雏形吗?本周五,DeepSeek 提交到 arXiv 上的最新论文正在 AI…
自去年以来,我们已经习惯了把复杂问题交给大模型。它们通常会陷入「深度思考」,有条不紊地展示思维链过程,并最终输…
最近,像 OpenAI o1/o3、DeepSeek-R1 这样的大型推理模型(Large Reasoning…
第一作者为哈尔滨工业大学(深圳)博士生王霄和华为大模型研究员佀庆一,该工作完成于王霄在华为实习期间。王霄的研究…
编辑 | 杨文 自从 GPT-4o 出了「吉卜力」滤镜后,社交媒体上简直是人均宫崎骏。 而这股「吉卜力热」也让…