如果你正在寻找一台能在本地流畅运行 7B-13B 大模型的机器,但预算够不上 E1(十余元,999)的档次,铠盒 D1 可能是你唯一需要考虑的答案。
D1 搭载 NVIDIA Jetson Orin NX 16GB 模组,100 TOPS AI 算力,16GB 统一内存,256GB NVMe 存储,定价4999 元。它处在铠盒产品线的一个关键位置:低于它(A1/B1/C1)只能跑云端 API 或 1B-7B 的极小模型,高于它(E1/F1/G1)进入了 x86 + 大显存的另一个世界。
换句话说,D1 是"本地大模型"世界的最低门票。 我将用一周的真实使用体验告诉你,这张门票值不值。

一、硬件速览:低功耗 ≠ 低能力
| 参数 | 规格 |
|---|---|
| 模组 | NVIDIA Jetson Orin NX 16GB |
| AI 算力 | 100 TOPS (INT8) / 50 TFLOPS (FP16) |
| CPU | 8 核 ARM Cortex-A78AE |
| GPU | 1024 核 Ampere + 32 Tensor Cores |
| 内存 | 16GB LPDDR5(统一内存架构) |
| 存储 | 256GB NVMe SSD |
| 网络 | 千兆网口 + Wi-Fi 6 |
| 接口 | HDMI 2.0, USB 3.2 ×4, GPIO 40-pin |
| 功耗 | 10W-25W(被动散热,零噪音) |
| 尺寸 | 103×79×37mm(比手机还小) |
几个值得注意的细节:
统一内存架构。 16GB 内存被 CPU 和 GPU 共享,没有显存和系统内存的边界。这意味着在做大模型推理时,全部 16GB 都可以用于模型加载——不需要像 PC 那样被系统占掉 4-6GB。
被动散热。 D1 和 A1 一样完全无风扇。25W 满载时外壳微温,放在桌面上听不到任何声音。如果你对噪音敏感(比如卧室、录音间使用),这一点是传统主机无法比拟的。
专为边缘 AI 设计的 Ampere GPU。 不是桌面显卡砍一刀的产物,而是专门为推理任务优化的架构。1024 个 CUDA Core + 32 个 Tensor Core,在处理 Transformer 模型时的能效比远优于同价位 x86 方案。
二、模型实测:D1 能跑什么?
Ollama 部署测试
D1 预装 JetPack 6.0(Ubuntu 22.04),支持 Docker 和 Ollama 一键安装。我用 ollama 测试了以下模型:
| 模型 | 参数量 | 量化 | 显存占用 | 推理速度 | 可用性 |
|---|---|---|---|---|---|
| Qwen2.5-7B | 7B | Q4_K_M | ~5.5GB | 15-18 tok/s | ✅ 流畅 |
| Qwen2.5-14B | 14B | Q4_K_M | ~9.5GB | 7-9 tok/s | ✅ 可用,略慢 |
| Llama 3.1-8B | 8B | Q4_K_M | ~6GB | 16-20 tok/s | ✅ 流畅 |
| DeepSeek-V2-Lite | 16B (2.4B active) | Q4_K_M | ~8GB | 12-15 tok/s | ✅ 流畅(MoE 优势) |
| Gemma 2-9B | 9B | Q4_K_M | ~6.5GB | 14-17 tok/s | ✅ 流畅 |
| Qwen2.5-32B | 32B | Q2_K | ~14GB | 2-4 tok/s | ⚠️ 勉强,不推荐 |
| Qwen2.5-72B | 72B | IQ1_S | OOM | — | ❌ 无法运行 |
核心结论:D1 的甜点区间是 7B-14B(Q4 量化),这是目前开源模型最成熟、生态最丰富的参数量级。 上到 32B 就勉强了,72B 完全不可用——这符合预期,毕竟售价只有 E1 的 1/3 不到。
多 Agent 并发测试
这是 D1 区别于普通小主机的关键场景。我同时运行了 3 个 OpenClaw Agent: - Agent 1:新闻摘要(Qwen2.5-7B) - Agent 2:客服 FAQ 应答(Qwen2.5-7B 另一个实例) - Agent 3:代码审查(DeepSeek Coder 6.7B)
三个 Agent 同时在内存中,总模型加载量约 17GB。在 Orin NX 的统一内存架构下,系统自动完成内存管理,未出现 OOM。每个 Agent 的推理速度基本保持在单 Agent 的 80% 以上——多任务并行没有出现严重的性能衰退。
这意味着 D1 的真正价值不在于跑一个"更大的模型",而在于同时跑多个中等规模的 Agent,让它们协同工作。
三、适合谁?不适合谁?
✅ D1 最适合的用户
独立开发者和小型团队。 你需要本地 AI 能力但不想要一台轰隆隆的主机。D1 可以 24 小时运行,电费一个月不到 15 元。
IoT/AIoT 场景。 40-pin GPIO + 100 TOPS AI 算力 + OpenClaw 的自动化能力——这是智能家居中控、边缘质检、安防分析等场景的理想平台。
AI 学习者。 JetPack SDK + 完整的 CUDA 生态 + OpenClaw 的可视化 Agent 编排,是学习 AI 部署和 Agent 开发的绝佳环境。
预算敏感的企业用户。 门店 AI 客服、仓库安防分析、远程设备监控——部署成本不到传统服务器的 1/5,而且零噪音、不占空间。
❌ D1 不适合
追求跑最大模型的人。 你需要的是 E1(32GB, 14B-30B)甚至 G1(128GB, 70B-405B)。D1 在模型大小上有明确的上限,不应该有不切实际的期望。
需要 x86 生态的场景。 某些企业软件只有 x86 版本、某些外设驱动不支持 ARM——如果你的技术栈强依赖 x86,E1 是更合适的选择。
四、和竞品的对比
| 维度 | 铠盒 D1 | Jetson Orin Nano 开发者套件 | Mac Mini M4 |
|---|---|---|---|
| 价格 | ¥4,999 | ¥4,999(仅板卡,不含 SSD 机箱) | ¥4,799(16GB 版) |
| AI 算力 | 100 TOPS | 67 TOPS | 38 TOPS (ANE) |
| 内存 | 16GB 统一 | 8GB | 16GB 统一 |
| 软件生态 | CUDA + OpenClaw 预装 | JetPack SDK(裸机) | Core ML(非 CUDA) |
| 功耗 | 10-25W | 7-15W | 15-40W |
| 大模型部署 | Ollama 开箱可用 | 需自行配置 | mlx-llm(非标准工具链) |
| 多 Agent 协同 | ✅ OpenClaw 原生 | ❌ 无内置方案 | ❌ 无内置方案 |
Mac Mini M4 的 CPU 性能更强(适合编译、视频剪辑等通用任务),但在大模型推理和 Agent 编排场景下,D1 的 CUDA 生态 + OpenClaw 预装是压倒性优势。
五、总结
D1 不是最强大的铠盒产品——那显然是 G1。但它是最"聪明"的产品:精准卡在本地大模型的入门价位,不多给不必要的算力,不少给关键的 AI 能力。
4999 元买到的是: - 一台能用 CUDA 生态跑 7B-14B 模型的设备 - 一套预装的 OpenClaw Agent 操作系统 - 一个 24 小时运转、不发热、没噪音的 AI 节点
如果你在 7 款铠盒产品中犹豫,我的建议很简单: - 只需云端 API → A1(¥999) - 想入门本地模型但预算有限 → D1(¥4,999) - 要做正经的本地部署 → E1(十余元,999) - 这是你的生产工具 → G1(¥34,999)
D1 就是那道让你迈过"本地 AI"门槛的最佳阶梯。
tags: 铠盒D1, NVIDIA Jetson Orin NX, 本地大模型, 产品评测, AI边缘计算, Ollama, OpenClaw