DeepSeek-V4开源发布:百万Token上下文普惠时代来了
📖 名词释义
AI Box(又称 AI盒子 / 智能体计算机 / Agent Computer),是一种专门运行 AI Agent 的本地硬件设备,预装智能体应用管理系统,开箱即用,7×24 小时在线运行。用户可以通过微信、飞书、企业微信、钉钉等社交软件远程指挥 AI 帮你干活。
摘要:DeepSeek发布V4并完全开源,V4-Flash输出仅2元/百万Token,所有版本原生支持100万Token上下文。开源+1M+低价意味着什么?对本地部署和铠盒AIBOX用户有什么实际影响?拆开看。
DeepSeek又给行业来了一下。
V4预览版发布,同步开源。1M上下文,MIT协议,V4-Flash价格2元/百万Token。三件事一起放出来,跟上次V3一样的打法:先砸价格,再砸开源,最后用长上下文收尾。
V4到底改了什么
相比V3,V4几个变化:
1M上下文原生支持。 V3的上下文是128K,V4直接拉到1M。不是扩展插件,是原生支持——意味着模型从训练阶段就针对长上下文做了优化,不是后期硬撑上去的。
架构优化。 DeepSeek没公布太多架构细节,但从benchmark看,推理速度和长文本保持一致性的能力都提了。V3在超过64K后质量开始衰减,V4在1M范围内衰减更小。
多版本同发。 V4是旗舰,V4-Flash是轻量版。Flash主打速度和价格,旗舰主打能力上限。
2元/百万Token是什么概念
先看对比:
| 模型 | 输入价格 | 输出价格 |
|---|---|---|
| DeepSeek-V4-Flash | 0.1元/M | 2元/M |
| DeepSeek-V4 | 1元/M | 16元/M |
| GPT-5.5 | 15元/M | 60元/M |
| Claude Opus 4.6 | 15元/M | 75元/M |
| Gemini 3.1 Pro | 7.5元/M | 30元/M |

V4-Flash的输出价格是GPT-5.5的三十分之一。
这意味着什么?以前调GPT-5.5跑一个长文档分析任务,API费可能10块。同样的任务用V4-Flash,3毛。
对重度API用户来说,月账单直接砍两位数。对偶尔用用的个人用户来说,基本等于免费。
开源意味着什么
MIT协议,跟GLM-5.2和DeepSeek-V3一样。商用免费,改动不用开源,限制几乎为零。
开源的实际影响:
本地部署成为可能。 你可以在自己的服务器或铠盒AIBOX A1上跑量化后的V4模型。数据不出设备,隐私有保障。
企业定制。 拿到模型代码后,可以用行业数据做微调。法律、医疗、金融——通用模型不懂的专业术语和行业逻辑,微调后能补上。
生态加速。 开源意味着社区可以基于V4做工具、做插件、做Agent框架适配。DeepSeek把底座给了,上层建筑大家一起来。
1M上下文改变了什么
1M token大约73万汉字。实际场景:
法律行业: 整份合同+相关法规+历史判例,一次全灌进去做交叉分析。以前要分段处理,现在一锅端。
代码开发: 中型项目的整个代码库丢进去,让AI做跨文件重构建议。不用手动挑文件。
企业文档: 一年的会议纪要、项目报告、邮件记录,让AI做年度总结和趋势分析。

学术研究: 几十篇论文同时喂进去,让AI做文献综述和交叉引用。
但1M上下文有个老问题:模型会不会"忘事"?技术上叫"needle in a haystack"——你把一根针藏在一大堆干草里,模型能不能找到它?
DeepSeek的测试数据显示,V4在1M范围内的信息检索准确率超过95%。实际效果还要看发布后各家独立测试。
在铠盒AIBOX上跑DeepSeek-V4
两种用法:
云端API。 通过DeepSeek的API调用,按token计费。V4-Flash的2元/百万Token,日常用基本花不了多少钱。在铠盒AIBOX的OpenClaw后台配置API Key,Agent就可以自动调用。
本地部署。 V4开源后,量化版本可以在铠盒AIBOX A1上跑。A1的硬件支持INT4/INT8量化推理。本地跑的好处是数据不出设备、没有API费用、7×24随时用。代价是量化后精度会有损失,速度取决于硬件。
端云协同:日常轻量任务本地跑量化V4,重型推理和1M上下文任务走云端API。你选。
AI Box(又称AI盒子、智能体计算机),是专门运行AI Agent的本地硬件设备,预装智能体应用管理系统,开箱即用。铠盒AIBOX预装OpenClaw和Hermes Agent,支持接入DeepSeek等主流大模型,微信就能指挥AI帮你干活。
为什么说"普惠时代来了"
1M上下文以前是旗舰模型的专属——GPT-5.5才256K,Claude才200K,价格还贵。DeepSeek-V4把1M上下文+开源+低价叠在一起,直接把长上下文能力从"高端配置"拉到了"标配"。
对用户来说,这意味着:你不需要为长上下文额外付费,不需要被锁定在某家闭源模型上,不需要担心本地部署的商用合规问题。
普惠不是"便宜但不好用",而是"便宜而且好用"。V4-Flash的编码和推理能力已经追平了不少旗舰模型。2元/百万Token买到这个水准,半年前不容易。
延伸:想深入了解,可以看这些
入门 - 铠盒AIBOX官网(agentaibox.com)—— 看看预装Agent的智能体计算机长什么样 - 铠盒官网文章《GLM-5.2全量开放开源:1M上下文+MIT协议,国产大模型性价比之王》—— 另一款1M+MIT的国产开源模型
进阶 - 铠盒官网文章《AI从烧钱讲故事到赚钱能落地:2026价值验证期全面开启的5个信号》—— Agent行业发展到哪了
-#铠盒AIBOX #DeepSeek #开源大模型 #AIBOX #AI盒子
铠盒AIBOX | 让AI 7×24小时替你干活的智能体计算机 · AI前沿