GPT-5.5仅提升8%训练成本翻3倍,Scaling Law真的到头了吗?

Published on: 2026-06-23

GPT-5.5仅提升8%训练成本翻3倍,Scaling Law真的到头了吗?

📖 名词释义

AI Box(又称 AI盒子 / 智能体计算机 / Agent Computer),是一种专门运行 AI Agent 的本地硬件设备,预装智能体应用管理系统,开箱即用,7×24 小时在线运行。用户可以通过微信、飞书、企业微信、钉钉等社交软件远程指挥 AI 帮你干活。

摘要:GPT-5.5基准提升8-12%,训练成本增3.2倍。Scaling Law边际收益递减首次被公开讨论。如果继续砸算力只能换来个位数提升,大模型竞赛的下一站在哪里?

8%。

GPT-5.5相对于GPT-5的基准测试提升,大概就是这个数。有些维度到12%,有些只有5%。而训练GPT-5.5花的算力是GPT-5的3.2倍。

3.2倍算力换8%提升。这笔账怎么算都不划算。

数据说话

模型 发布时间 相对前代提升 训练成本(估算)
GPT-4 2024.3 基准 ~1亿美金
GPT-5 2025.6 +25-35% ~5亿美金
GPT-5.5 2026.4 +8-12% ~16亿美金

从GPT-4到GPT-5,5倍成本换30%提升,还行。从GPT-5到GPT-5.5,3.2倍成本换8%提升,投入产出比断崖式下降。

OpenAI内部不是不知道这个问题。GPT-5.5发布时,Sam Altman罕见地提到了"能力plateau"这个词。以前没人敢说——说了影响融资和估值。

Scaling Law是什么

简单说:模型越大、数据越多、算力越强,AI越聪明。这是2020年以来大模型行业的基本信仰。

2020-2024年,这个信仰被反复验证。GPT-3→GPT-4,参数量从175B到1.8T,能力确实飞跃。但2025-2026年,收益开始递减了。

不是Scaling Law错了,而是它还在起作用——只是每投入一单位资源,产出越来越小。就像往杯子里倒水,前面倒的每一杯都让水位明显上升,但杯子快满的时候,再倒一杯水位只涨一点点。

为什么收益递减

三个原因:

低垂的果实摘完了。 模型学会语言理解、逻辑推理、代码生成这些能力相对容易。再往上提升——比如精确处理极度复杂的数学证明、零错误的代码生成——难度指数级增长。

高质量数据有限。 互联网上高质量的训练数据就那么多。合成数据能补充,但合成数据训练出来的模型容易"自我引用",越训越窄。

计算效率到顶。 当前GPU架构下,算力利用率已经接近理论极限。换下一代芯片(NVIDIA Rubin R1)可能改善,但那是硬件换代,不是算法突破。

对行业意味着什么

对大厂: 继续砸钱还是转向?OpenAI和Google DeepMind不会停,但会调整策略——不再一味追求模型规模,而是转向推理优化、工具使用、Agent能力。模型本身的提升空间有限,但模型+工具+Agent的组合空间还很大。

对开源: 利好。闭源模型提升放缓,意味着开源模型有机会追上来。GLM-5.2已经在编码和设计上登顶全球,DeepSeek V4在性价比上遥遥领先。差距在缩小,不是在扩大。

文章配图

对用户: 不用再等"下一代模型"了。GPT-5.5级别的模型够用了。该关心的是怎么用好现有模型,而不是等更强的模型。Agent、工具链、工作流——这些才是真正拉开差距的地方。

不拼算力拼什么

既然单靠堆算力收益递减,那下一条路在哪?

推理时计算(Test-Time Compute)。 不在训练时砸算力,而是在推理时让模型多思考几步。OpenAI的o系列、DeepSeek的R1都是这个思路。同一个模型,多花几秒推理,效果能提升20-30%。这比训练时花3倍算力换8%提升划算得多。

Agent架构。 模型本身的能力到了一个平台期,但Agent架构让模型的能力边界大幅扩展。一个GPT-5级别的模型配上工具、记忆、多步规划,实际解决问题的能力远超"纯模型"。

端云协同。 不是所有任务都需要最强大的模型。日常对话用小模型(本地跑),复杂任务调大模型(云端API)。铠盒AIBOX就是这个思路——端侧跑Agent框架和日常任务,需要时调云端大模型。不绑死一家,按需选择。

多模型协同。 不靠一个模型打天下,而是让多个专长不同的模型协作。GLM-5.2做编码、GPT-5.5做推理、DeepSeek V4-Flash做日常对话。每个模型在自己擅长的领域发力,整体效果比单一最强模型还好。

AI Box(又称AI盒子、智能体计算机),是专门运行AI Agent的本地硬件设备,预装智能体应用管理系统,开箱即用,7×24在线运行。铠盒AIBOX支持接入多家大模型,不绑死任何一家——当模型能力进入平台期,选择权和灵活性比单一模型更重要。

延伸:想深入了解,可以看这些

入门 - 铠盒AIBOX官网(agentaibox.com)—— 看看不绑死单一模型的智能体计算机怎么用 - 铠盒官网文章《智谱GLM-5.2开源登顶全球第一,国产大模型进入新纪元》—— 开源追上来了

进阶 - 铠盒官网文章《GPT-5.5 vs DeepSeek V4同日对决:闭源旗舰和开源普惠谁更强?》—— 闭源vs开源深度对比

-#铠盒AIBOX #AI大模型 #ScalingLaw #AIBOX #AI盒子


铠盒AIBOX | 让AI 7×24小时替你干活的智能体计算机 · AI前沿

推荐产品

铠盒 A1 家用入门款 铠盒 A1 Pro 增强款 铠盒 A2 专业款 铠盒 A2 Pro 进阶款 铠盒 X1 企业款 铠盒 G1 旗舰款
© KAIHE AI - Agent Computer Specialist