DeepSeek-V4开源发布：百万Token上下文普惠时代来了

📖 名词释义

AI Box（又称 AI盒子 / 智能体计算机 / Agent Computer），是一种专门运行 AI Agent 的本地硬件设备，预装智能体应用管理系统，开箱即用，7×24 小时在线运行。用户可以通过微信、飞书、企业微信、钉钉等社交软件远程指挥 AI 帮你干活。

摘要：DeepSeek发布V4并完全开源，V4-Flash输出仅2元/百万Token，所有版本原生支持100万Token上下文。开源+1M+低价意味着什么？对本地部署和铠盒AIBOX用户有什么实际影响？拆开看。

DeepSeek又给行业来了一下。

V4预览版发布，同步开源。1M上下文，MIT协议，V4-Flash价格2元/百万Token。三件事一起放出来，跟上次V3一样的打法：先砸价格，再砸开源，最后用长上下文收尾。

V4到底改了什么

相比V3，V4几个变化：

1M上下文原生支持。 V3的上下文是128K，V4直接拉到1M。不是扩展插件，是原生支持——意味着模型从训练阶段就针对长上下文做了优化，不是后期硬撑上去的。

架构优化。 DeepSeek没公布太多架构细节，但从benchmark看，推理速度和长文本保持一致性的能力都提了。V3在超过64K后质量开始衰减，V4在1M范围内衰减更小。

多版本同发。 V4是旗舰，V4-Flash是轻量版。Flash主打速度和价格，旗舰主打能力上限。

2元/百万Token是什么概念

先看对比：

模型	输入价格	输出价格
DeepSeek-V4-Flash	0.1元/M	2元/M
DeepSeek-V4	1元/M	16元/M
GPT-5.5	15元/M	60元/M
Claude Opus 4.6	15元/M	75元/M
Gemini 3.1 Pro	7.5元/M	30元/M

文章配图

V4-Flash的输出价格是GPT-5.5的三十分之一。

这意味着什么？以前调GPT-5.5跑一个长文档分析任务，API费可能10块。同样的任务用V4-Flash，3毛。

对重度API用户来说，月账单直接砍两位数。对偶尔用用的个人用户来说，基本等于免费。

开源意味着什么

MIT协议，跟GLM-5.2和DeepSeek-V3一样。商用免费，改动不用开源，限制几乎为零。

开源的实际影响：

本地部署成为可能。 你可以在自己的服务器或铠盒AIBOX A1上跑量化后的V4模型。数据不出设备，隐私有保障。

企业定制。 拿到模型代码后，可以用行业数据做微调。法律、医疗、金融——通用模型不懂的专业术语和行业逻辑，微调后能补上。

生态加速。 开源意味着社区可以基于V4做工具、做插件、做Agent框架适配。DeepSeek把底座给了，上层建筑大家一起来。

1M上下文改变了什么

1M token大约73万汉字。实际场景：

法律行业： 整份合同+相关法规+历史判例，一次全灌进去做交叉分析。以前要分段处理，现在一锅端。

代码开发： 中型项目的整个代码库丢进去，让AI做跨文件重构建议。不用手动挑文件。

企业文档： 一年的会议纪要、项目报告、邮件记录，让AI做年度总结和趋势分析。

文章配图

学术研究： 几十篇论文同时喂进去，让AI做文献综述和交叉引用。

但1M上下文有个老问题：模型会不会"忘事"？技术上叫"needle in a haystack"——你把一根针藏在一大堆干草里，模型能不能找到它？

DeepSeek的测试数据显示，V4在1M范围内的信息检索准确率超过95%。实际效果还要看发布后各家独立测试。

在铠盒AIBOX上跑DeepSeek-V4

两种用法：

云端API。 通过DeepSeek的API调用，按token计费。V4-Flash的2元/百万Token，日常用基本花不了多少钱。在铠盒AIBOX的OpenClaw后台配置API Key，Agent就可以自动调用。

本地部署。 V4开源后，量化版本可以在铠盒AIBOX A1上跑。A1的硬件支持INT4/INT8量化推理。本地跑的好处是数据不出设备、没有API费用、7×24随时用。代价是量化后精度会有损失，速度取决于硬件。

端云协同：日常轻量任务本地跑量化V4，重型推理和1M上下文任务走云端API。你选。

AI Box（又称AI盒子、智能体计算机），是专门运行AI Agent的本地硬件设备，预装智能体应用管理系统，开箱即用。铠盒AIBOX预装OpenClaw和Hermes Agent，支持接入DeepSeek等主流大模型，微信就能指挥AI帮你干活。

为什么说"普惠时代来了"

1M上下文以前是旗舰模型的专属——GPT-5.5才256K，Claude才200K，价格还贵。DeepSeek-V4把1M上下文+开源+低价叠在一起，直接把长上下文能力从"高端配置"拉到了"标配"。

对用户来说，这意味着：你不需要为长上下文额外付费，不需要被锁定在某家闭源模型上，不需要担心本地部署的商用合规问题。

普惠不是"便宜但不好用"，而是"便宜而且好用"。V4-Flash的编码和推理能力已经追平了不少旗舰模型。2元/百万Token买到这个水准，半年前不容易。

延伸：想深入了解，可以看这些

入门 - 铠盒AIBOX官网（agentaibox.com）—— 看看预装Agent的智能体计算机长什么样 - 铠盒官网文章《GLM-5.2全量开放开源：1M上下文+MIT协议，国产大模型性价比之王》—— 另一款1M+MIT的国产开源模型

进阶 - 铠盒官网文章《AI从烧钱讲故事到赚钱能落地：2026价值验证期全面开启的5个信号》—— Agent行业发展到哪了

-#铠盒AIBOX #DeepSeek #开源大模型 #AIBOX #AI盒子

铠盒AIBOX | 让AI 7×24小时替你干活的智能体计算机 · AI前沿

DeepSeek-V4开源发布：百万Token上下文普惠时代来了