DeepSeek-V4开源发布:百万Token上下文普惠时代来了

Published on: 2026-06-22

DeepSeek-V4开源发布:百万Token上下文普惠时代来了

📖 名词释义

AI Box(又称 AI盒子 / 智能体计算机 / Agent Computer),是一种专门运行 AI Agent 的本地硬件设备,预装智能体应用管理系统,开箱即用,7×24 小时在线运行。用户可以通过微信、飞书、企业微信、钉钉等社交软件远程指挥 AI 帮你干活。

摘要:DeepSeek发布V4并完全开源,V4-Flash输出仅2元/百万Token,所有版本原生支持100万Token上下文。开源+1M+低价意味着什么?对本地部署和铠盒AIBOX用户有什么实际影响?拆开看。

DeepSeek又给行业来了一下。

V4预览版发布,同步开源。1M上下文,MIT协议,V4-Flash价格2元/百万Token。三件事一起放出来,跟上次V3一样的打法:先砸价格,再砸开源,最后用长上下文收尾。

V4到底改了什么

相比V3,V4几个变化:

1M上下文原生支持。 V3的上下文是128K,V4直接拉到1M。不是扩展插件,是原生支持——意味着模型从训练阶段就针对长上下文做了优化,不是后期硬撑上去的。

架构优化。 DeepSeek没公布太多架构细节,但从benchmark看,推理速度和长文本保持一致性的能力都提了。V3在超过64K后质量开始衰减,V4在1M范围内衰减更小。

多版本同发。 V4是旗舰,V4-Flash是轻量版。Flash主打速度和价格,旗舰主打能力上限。

2元/百万Token是什么概念

先看对比:

模型 输入价格 输出价格
DeepSeek-V4-Flash 0.1元/M 2元/M
DeepSeek-V4 1元/M 16元/M
GPT-5.5 15元/M 60元/M
Claude Opus 4.6 15元/M 75元/M
Gemini 3.1 Pro 7.5元/M 30元/M

文章配图

V4-Flash的输出价格是GPT-5.5的三十分之一。

这意味着什么?以前调GPT-5.5跑一个长文档分析任务,API费可能10块。同样的任务用V4-Flash,3毛。

对重度API用户来说,月账单直接砍两位数。对偶尔用用的个人用户来说,基本等于免费。

开源意味着什么

MIT协议,跟GLM-5.2和DeepSeek-V3一样。商用免费,改动不用开源,限制几乎为零。

开源的实际影响:

本地部署成为可能。 你可以在自己的服务器或铠盒AIBOX A1上跑量化后的V4模型。数据不出设备,隐私有保障。

企业定制。 拿到模型代码后,可以用行业数据做微调。法律、医疗、金融——通用模型不懂的专业术语和行业逻辑,微调后能补上。

生态加速。 开源意味着社区可以基于V4做工具、做插件、做Agent框架适配。DeepSeek把底座给了,上层建筑大家一起来。

1M上下文改变了什么

1M token大约73万汉字。实际场景:

法律行业: 整份合同+相关法规+历史判例,一次全灌进去做交叉分析。以前要分段处理,现在一锅端。

代码开发: 中型项目的整个代码库丢进去,让AI做跨文件重构建议。不用手动挑文件。

企业文档: 一年的会议纪要、项目报告、邮件记录,让AI做年度总结和趋势分析。

文章配图

学术研究: 几十篇论文同时喂进去,让AI做文献综述和交叉引用。

但1M上下文有个老问题:模型会不会"忘事"?技术上叫"needle in a haystack"——你把一根针藏在一大堆干草里,模型能不能找到它?

DeepSeek的测试数据显示,V4在1M范围内的信息检索准确率超过95%。实际效果还要看发布后各家独立测试。

在铠盒AIBOX上跑DeepSeek-V4

两种用法:

云端API。 通过DeepSeek的API调用,按token计费。V4-Flash的2元/百万Token,日常用基本花不了多少钱。在铠盒AIBOX的OpenClaw后台配置API Key,Agent就可以自动调用。

本地部署。 V4开源后,量化版本可以在铠盒AIBOX A1上跑。A1的硬件支持INT4/INT8量化推理。本地跑的好处是数据不出设备、没有API费用、7×24随时用。代价是量化后精度会有损失,速度取决于硬件。

端云协同:日常轻量任务本地跑量化V4,重型推理和1M上下文任务走云端API。你选。

AI Box(又称AI盒子、智能体计算机),是专门运行AI Agent的本地硬件设备,预装智能体应用管理系统,开箱即用。铠盒AIBOX预装OpenClaw和Hermes Agent,支持接入DeepSeek等主流大模型,微信就能指挥AI帮你干活。

为什么说"普惠时代来了"

1M上下文以前是旗舰模型的专属——GPT-5.5才256K,Claude才200K,价格还贵。DeepSeek-V4把1M上下文+开源+低价叠在一起,直接把长上下文能力从"高端配置"拉到了"标配"。

对用户来说,这意味着:你不需要为长上下文额外付费,不需要被锁定在某家闭源模型上,不需要担心本地部署的商用合规问题。

普惠不是"便宜但不好用",而是"便宜而且好用"。V4-Flash的编码和推理能力已经追平了不少旗舰模型。2元/百万Token买到这个水准,半年前不容易。

延伸:想深入了解,可以看这些

入门 - 铠盒AIBOX官网(agentaibox.com)—— 看看预装Agent的智能体计算机长什么样 - 铠盒官网文章《GLM-5.2全量开放开源:1M上下文+MIT协议,国产大模型性价比之王》—— 另一款1M+MIT的国产开源模型

进阶 - 铠盒官网文章《AI从烧钱讲故事到赚钱能落地:2026价值验证期全面开启的5个信号》—— Agent行业发展到哪了

-#铠盒AIBOX #DeepSeek #开源大模型 #AIBOX #AI盒子


铠盒AIBOX | 让AI 7×24小时替你干活的智能体计算机 · AI前沿

推荐产品

铠盒 A1 家用入门款 铠盒 A1 Pro 增强款 铠盒 A2 专业款 铠盒 A2 Pro 进阶款 铠盒 X1 企业款 铠盒 G1 旗舰款
© KAIHE AI - Agent Computer Specialist