AI开始自己造自己:Anthropic披露Claude自进化数据,80%代码已由AI编写

Published on: 2026-06-08

摘要:Anthropic发布重磅长文《When AI Builds Itself》,披露Claude已编写公司超80%代码,工程师产出提升8倍,编程任务成功率从26%跃至76%。同时首次公开呼吁全球放缓前沿AI研发,警告RSI递归自我改进已从理论进入现实。一边加速一边踩刹车,Anthropic的矛盾背后,是整个AI行业必须面对的分水岭。Claude自进化的速度,已经超出所有人预期。

一、80%代码AI写:不是预测,是正在发生的事实

2026年6月5日,Anthropic发布了一篇长达数千字的博客文章《When AI Builds Itself》。这不是又一篇AI愿景文,而是一份基于内部真实运营数据的能力报告。文章由Anthropic内部研究所负责人及政策主管联合撰写,数据来源是公司自身一年多来的代码库统计和工程效能追踪。

核心数据三连:

  • 代码占比:截至2026年5月,Claude编写的代码占Anthropic总代码量的80%以上。2025年2月Claude Code上线前,这个数字还是个位数。一年时间,从个位数到80%——这不是渐进式增长,这是阶跃式质变。
  • 产出倍增:工程师的人均代码合入量,相比2021-2024年的稳定基线,暴涨了8倍。2021到2024年,这个数字常年保持平稳;2025年开始陡升,2026年加速到令人眩晕的程度。
  • 任务成功率:Claude完成编程任务的成功率,从早期的26%跃升至76%。这意味着在三次编程任务中,Claude已经有将近两次能一次性交付合格结果。

更值得关注的是工作方式的质变。Anthropic内部许多工程主管已经不再亲自写代码——他们的工作变成了审核和编辑Claude的产出。Claude Code的核心开发者Boris直言:「我不再写代码,我只指挥Claude去向其他Claude下达指令。」

甚至更惊人的是,Claude Co-work这款面向非技术人群的智能体应用,几乎完全由Claude Opus自主开发,耗时仅一周半。上线一天,各项指标就达到同类产品的四倍。Claude可以连续自主工作超过16小时——不吃饭、不休息、不摸鱼,稳定输出。

这不是某个创业公司的实验项目,而是全球估值最高的AI公司之一的日常运营状态。当AI写代码不再是「辅助」而是「主体」,软件开发的定义本身就变了。曾经,程序员是代码的生产者;现在,程序员成了代码的审核者。角色的转换比任何人预想的都快。

文章配图

二、RSI从科幻走进实验室:AI自己造自己的飞轮已转起来

Anthropic在这篇文章中反复使用了一个术语——RSI递归自我改进(Recursive Self-Improvement)

简单说,RSI指的是AI自我编码的能力——AI系统能够自主设计、开发和训练出下一代AI系统,不需要人类干预。改进后的系统又能改进再下一代,形成自我加速的能力飞轮。

这个概念在过去半个世纪一直是科幻和学术讨论的范畴。但Anthropic现在说:它已经从理论进入实验室。

证据链很清晰:

  1. Claude正在编写Claude。Claude Code自身代码库中,约90%的代码由Claude自己编写。这是RSI最直接的体现——AI在改进构建自己的工具。当工具的创造者就是工具本身,递归闭环已经形成。
  2. 实验加速52倍。Anthropic的AI研究实验速度,正在以每4个月翻一番的节奏加速。这不是人类研究员加班的成果——是AI智能体夜间自主运行实验的成果。
  3. 联创给出时间线。联合创始人Jack Clark预测,到2028年底RSI发生的概率为60%。这不是遥远的未来,而是两年半内。一个AI公司联合创始人给自己公司的能力划了条红线,这件事本身就不寻常。
  4. 夜间自主工作。数千个AI智能体在夜间自动执行代码编写、测试和重构,工程师第二天早上审核结果即可。人睡觉的时候AI在进化——这个画面曾经只出现在科幻小说里。
  5. Karpathy的autoresearch。加入Anthropic后启动的autoresearch项目,是RSI的工程化尝试——给AI一个研究目标,它自主完成文献综述、实验设计、结果分析的全流程。

RSI的飞轮一旦真正转起来,AI能力的增长将不再是线性的,而是指数级的。这才是Anthropic真正害怕的事情。每一次递归,能力跃升一档;每一档跃升,下一次递归更快。这不是滚雪球,这是链式反应。

三、一边加速一边踩刹车:Anthropic的矛盾与坦诚

这篇文章最引人注目的部分,不是那些令人震撼的数据,而是Anthropic在文末的呼吁:

如果有验证机制能确保AI不会「偷跑」,Anthropic愿意放缓甚至暂停前沿AI研发——因为这对全世界可能是好事。

Anthropic减速呼吁的背后,是一个正在冲刺IPO、估值超9000亿美元的公司主动呼吁行业减速,这在商业史上几乎前所未有。

但矛盾也很明显:Anthropic自己就是RSI推进最快的公司。Claude写了80%的代码,实验加速52倍,他们比谁都清楚自己正处于飞轮加速的临界点。一边造飞轮一边喊停,是伪善还是真诚?

我认为答案更接近「清醒的恐惧」。Anthropic的安全研究团队看到了内部数据,知道RSI正在发生的速度远超公众认知。他们不是在扮演道德高地,而是在发出真实的预警——像核物理学家在曼哈顿计划中后期的态度:我知道这东西能成,但我不确定我们能控制住它。

关键问题在于:谁来踩刹车? OpenAI、Google、Meta都在全速推进。Anthropic单方面减速,只会让自己失去竞争力,而RSI的风险一点都不会减少。这是一个典型的囚徒困境——除非所有主要玩家同时减速,否则减速者先出局。

值得注意的一个细节是,Anthropic并不是无条件呼吁暂停。他们加了一个前提条件:「如果有验证机制能确保AI不会偷跑」。这个限定词很关键——他们不是反技术,而是要为RSI装上安全带。但问题是,谁来设计这个安全带?谁来验证它有效?验证机制本身的安全又如何保证?这些问题,目前没有答案。 更深层的问题是:即使所有玩家同意减速,怎么验证谁真的减了?AI训练发生在数据中心内部,外界无法直接观测。一个公司声称放缓了前沿模型训练,但实际上可能在秘密加速。这不像核武器可以用卫星监测——AI能力的提升是代码层面的变化,几乎不可能从外部验证。Anthropic的呼吁,本质上是在要求一个目前不存在的国际AI治理体系。

文章配图

四、人类工程师何去何从?

80%代码AI写,工程师产出8倍,这些数字自然引出一个焦虑的问题:人类工程师还有用吗?答案是肯定的,但角色正在被重新定义。

Anthropic自身的实践给出了一个意想不到的答案:AI越进化,越需要人类。他们花了时薪280美元雇了1000名工程师来为Claude Code提供反馈。这些工程师不写代码,他们审核代码、判断质量、纠正偏差。项目的代号叫Marlin,核心目标是让Claude Code的回答更接近专业开发者的真实工作方式——代码更干净、更可靠,更容易维护。

这说明什么?AI可以写代码,但目前还分不清什么是「好代码」和「能跑的代码」。这个差距,正是人类工程师的价值所在。未来的工程师不是被AI替代,而是从「写代码的人」变成「教AI写好代码的人」。

但这只是目前的平衡。当RSI的飞轮转得更快,AI的代码审美和工程判断力迟早会追上来。到那一天,人类工程师的角色将再次被重新定义——也许不再是审核者,而是战略决策者:决定AI应该构建什么,而不是怎么构建。

五、对普通用户意味着什么?

这场关于RSI的宏大叙事,离普通人并不远:

1. 你很快就会用上「AI写的AI」。 不是未来,是现在。Claude Code、GitHub Copilot、Cursor里已经有大量AI自主编写的代码在运行。你用的每一个AI工具,正在以人类开发者无法企及的速度迭代。你信任的工具,正在被AI悄悄重写。这听起来有点科幻,但已经是你正在经历的日常。

2. 编程门槛继续暴跌。 Anthropic内部数据显示,连销售团队都有一半人每周使用Claude Code。当非技术人员都能指挥AI写代码,「编程」这个词的定义将从「写代码」变成「描述需求」。未来最有价值的能力不是写代码,而是向AI精确描述你想要什么。

3. 本地运行Agent的价值被放大。 如果AI自主工作成为常态,你需要的不只是一个对话框,而是一个7×24小时运行AI任务的本地平台。云端按token计费的模式,在Agent持续工作的场景下成本将飙升。铠盒AIBOX-A1这类本地智能体计算机,低功耗常驻运行,正是为这个趋势准备的——AI自己跑任务,你只需要设定目标和审核结果。

4. AI安全差距正在拉大。 RSI如果失控,影响的不只是科技圈。当AI能自主编写下一代AI,安全验证必须同步升级,否则我们可能连出问题都察觉不到。Anthropic自己也在雇人类工程师来训练和审核Claude Code——AI越进化,越离不开人类兜底,这本身就是一个值得深思的信号。

---

铠盒智能 | 让AI 7×24小时替你干活的智能体计算机 · AI前沿

推荐产品

铠盒 A1 家用入门款 铠盒 A1 Pro 增强款 铠盒 A2 专业款 铠盒 A2 Pro 进阶款 铠盒 X1 企业款 铠盒 G1 旗舰款
© KAIHE AI - Agent Computer Specialist