智谱GLM-5.2开源登顶：开源模型首次追平Claude Opus 4.8

📖 名词释义

AI Box（又称 AI盒子 / 智能体计算机 / Agent Computer），是一种专门运行 AI Agent 的本地硬件设备，预装智能体应用管理系统，开箱即用，7×24 小时在线运行。用户可以通过微信、飞书、企业微信、钉钉等社交软件远程指挥 AI 帮你干活。

摘要：6月17日，智谱AI正式发布并开源GLM-5.2，MIT协议全量开放。在Code Arena全球百万用户盲测中拿下可用模型第一，FrontierSWE长周期工程基准仅比Claude Opus 4.8低1%，超越GPT-5.5。1M上下文稳定无损，BridgeBench推理榜全球第一。开源模型在编码和长程任务上首次追平闭源前沿。

6月17日，智谱AI正式发布GLM-5.2并同步开源。MIT协议，模型权重、训练代码全部公开，商用零成本。

这不是一次普通的开源发布。GLM-5.2在Code Arena（超百万用户参与的全球盲测平台）上拿下可用模型第一；在FrontierSWE长周期工程基准测试中拿到74.4%，仅比Claude Opus 4.8低1%，同时以1.8%的优势超过GPT-5.5。这是开源模型第一次在编码和长程任务上站到和闭源前沿同一梯队的位置。

四个核心数据

基准测试	GLM-5.2成绩	对比
Code Arena	全球可用模型第一	超百万用户盲测
FrontierSWE	74.4%	Opus 4.8为75.1%，GPT-5.5为72.6%
BridgeBench	全球第一	击败此前被封锁的Fable 5
Artificial Analysis	51分（开源SOTA）	位列全球第四

FrontierSWE是专门评测Agent在数小时甚至数十小时内完成全栈工程任务能力的基准。GLM-5.2在这个测试中比上一代闭源王者Opus 4.7高出11个百分点，和最新的Opus 4.8差距收窄到1%以内。

文章配图

1M上下文：不是噱头

市面上声称支持100万token上下文的模型不少，但大多数在超过数十K之后就开始"失忆"。

GLM-5.2的1M上下文是实打实能用的。在实测中，它可以一次性处理88万tokens，完整交付覆盖Web、移动端与小程序的多端应用。过去需要一支团队协作数周的工程，现在一个Agent跑完。

这种长上下文能力来自架构创新。GLM-5.2引入了IndexShare机制，通过索引共享让模型在超长上下文中保持信息检索的准确性，而不是简单的注意力窗口扩展。

长程任务：能持续干活不跑偏

GLM-5.2的核心定位不是"更聪明"，而是"能持续干很久还不跑偏"。

传统大模型在多轮交互中容易累积误差，跑着跑着就偏离了原始目标。GLM-5.2专门针对长程任务做了强化训练，在PostTrainBench（最长10小时连续任务）中取得34.3%，介于Opus 4.7和4.8之间，是排名最高的开源模型。

这意味着什么？一个Agent可以连续工作数小时，自主跑完一个完整的大型工程，不需要人一直在旁边纠偏。这是从"问答工具"到"执行式AI"的关键跨越。

文章配图

MIT开源：真正的技术无国界

GLM-5.2采用MIT协议开源，这是最宽松的开源许可之一。不是"开源一部分权重"，是连训练代码、数据集、模型权重全部公开。

商用不用付一分钱，不用向智谱报备，没有使用限制。这对国内开发者来说意味着什么？可以拿GLM-5.2做自己的产品，不用担心授权问题。

智谱还全面适配了主流国产算力芯片。在当前国际芯片出口管制的背景下，这一点具有战略意义——开源模型+国产算力，形成了一套不完全依赖外部供应链的AI技术栈。

API定价争议

GLM-5.2的API定价是8元/百万输入tokens，不少开发者觉得"开源模型为什么API还这么贵"。

这个定价逻辑其实可以理解。开源的是模型本身，你可以自己部署，成本只有算力。但用智谱的API，你付的是推理服务费+带宽+运维+可用性保障。和Claude Opus 4.8的15美元/百万tokens相比，8元人民币已经是大幅度降价了。

如果预算敏感，自己部署GLM-5.2才是最优解。这也是MIT开源的核心价值——给你选择权，而不是绑死在某一家的API上。

Coding御三家格局初现

GLM-5.2发布后，智谱市值突破9000亿港币。资本市场用真金白银投了票。

在AI编程领域，此前全球头部长期只有Anthropic的Claude和OpenAI的GPT。GLM-5.2凭借Code Arena第一的成绩和"Opus平价"口碑，正在推动形成由Anthropic、OpenAI、智谱构成的"Coding御三家"格局。

对铠盒AIBOX这样的本地AI智能体硬件来说，GLM-5.2的开源意味着用户多了一个强大的模型选择。端云协同架构下，Agent可以根据任务类型动态选择模型——编程和长程任务用GLM-5.2，日常对话用轻量模型，把成本和性能做到最优平衡。

智谱GLM-5.2开源登顶：开源模型首次追平Claude Opus 4.8