铠盒 D1 深度评测:把 100 TOPS 算力装进桌面的真实体验

Published on: 2026-05-13

如果你正在寻找一台能在本地流畅运行 7B-13B 大模型的机器,但预算够不上 E1(十余元,999)的档次,铠盒 D1 可能是你唯一需要考虑的答案。

D1 搭载 NVIDIA Jetson Orin NX 16GB 模组,100 TOPS AI 算力,16GB 统一内存,256GB NVMe 存储,定价4999 元。它处在铠盒产品线的一个关键位置:低于它(A1/B1/C1)只能跑云端 API 或 1B-7B 的极小模型,高于它(E1/F1/G1)进入了 x86 + 大显存的另一个世界。

换句话说,D1 是"本地大模型"世界的最低门票。 我将用一周的真实使用体验告诉你,这张门票值不值。


插图

一、硬件速览:低功耗 ≠ 低能力

参数 规格
模组 NVIDIA Jetson Orin NX 16GB
AI 算力 100 TOPS (INT8) / 50 TFLOPS (FP16)
CPU 8 核 ARM Cortex-A78AE
GPU 1024 核 Ampere + 32 Tensor Cores
内存 16GB LPDDR5(统一内存架构)
存储 256GB NVMe SSD
网络 千兆网口 + Wi-Fi 6
接口 HDMI 2.0, USB 3.2 ×4, GPIO 40-pin
功耗 10W-25W(被动散热,零噪音)
尺寸 103×79×37mm(比手机还小)

几个值得注意的细节:

统一内存架构。 16GB 内存被 CPU 和 GPU 共享,没有显存和系统内存的边界。这意味着在做大模型推理时,全部 16GB 都可以用于模型加载——不需要像 PC 那样被系统占掉 4-6GB。

被动散热。 D1 和 A1 一样完全无风扇。25W 满载时外壳微温,放在桌面上听不到任何声音。如果你对噪音敏感(比如卧室、录音间使用),这一点是传统主机无法比拟的。

专为边缘 AI 设计的 Ampere GPU。 不是桌面显卡砍一刀的产物,而是专门为推理任务优化的架构。1024 个 CUDA Core + 32 个 Tensor Core,在处理 Transformer 模型时的能效比远优于同价位 x86 方案。


二、模型实测:D1 能跑什么?

Ollama 部署测试

D1 预装 JetPack 6.0(Ubuntu 22.04),支持 Docker 和 Ollama 一键安装。我用 ollama 测试了以下模型:

模型 参数量 量化 显存占用 推理速度 可用性
Qwen2.5-7B 7B Q4_K_M ~5.5GB 15-18 tok/s ✅ 流畅
Qwen2.5-14B 14B Q4_K_M ~9.5GB 7-9 tok/s ✅ 可用,略慢
Llama 3.1-8B 8B Q4_K_M ~6GB 16-20 tok/s ✅ 流畅
DeepSeek-V2-Lite 16B (2.4B active) Q4_K_M ~8GB 12-15 tok/s ✅ 流畅(MoE 优势)
Gemma 2-9B 9B Q4_K_M ~6.5GB 14-17 tok/s ✅ 流畅
Qwen2.5-32B 32B Q2_K ~14GB 2-4 tok/s ⚠️ 勉强,不推荐
Qwen2.5-72B 72B IQ1_S OOM ❌ 无法运行

核心结论:D1 的甜点区间是 7B-14B(Q4 量化),这是目前开源模型最成熟、生态最丰富的参数量级。 上到 32B 就勉强了,72B 完全不可用——这符合预期,毕竟售价只有 E1 的 1/3 不到。

多 Agent 并发测试

这是 D1 区别于普通小主机的关键场景。我同时运行了 3 个 OpenClaw Agent: - Agent 1:新闻摘要(Qwen2.5-7B) - Agent 2:客服 FAQ 应答(Qwen2.5-7B 另一个实例) - Agent 3:代码审查(DeepSeek Coder 6.7B)

三个 Agent 同时在内存中,总模型加载量约 17GB。在 Orin NX 的统一内存架构下,系统自动完成内存管理,未出现 OOM。每个 Agent 的推理速度基本保持在单 Agent 的 80% 以上——多任务并行没有出现严重的性能衰退。

这意味着 D1 的真正价值不在于跑一个"更大的模型",而在于同时跑多个中等规模的 Agent,让它们协同工作。


三、适合谁?不适合谁?

✅ D1 最适合的用户

独立开发者和小型团队。 你需要本地 AI 能力但不想要一台轰隆隆的主机。D1 可以 24 小时运行,电费一个月不到 15 元。

IoT/AIoT 场景。 40-pin GPIO + 100 TOPS AI 算力 + OpenClaw 的自动化能力——这是智能家居中控、边缘质检、安防分析等场景的理想平台。

AI 学习者。 JetPack SDK + 完整的 CUDA 生态 + OpenClaw 的可视化 Agent 编排,是学习 AI 部署和 Agent 开发的绝佳环境。

预算敏感的企业用户。 门店 AI 客服、仓库安防分析、远程设备监控——部署成本不到传统服务器的 1/5,而且零噪音、不占空间。

❌ D1 不适合

追求跑最大模型的人。 你需要的是 E1(32GB, 14B-30B)甚至 G1(128GB, 70B-405B)。D1 在模型大小上有明确的上限,不应该有不切实际的期望。

需要 x86 生态的场景。 某些企业软件只有 x86 版本、某些外设驱动不支持 ARM——如果你的技术栈强依赖 x86,E1 是更合适的选择。


四、和竞品的对比

维度 铠盒 D1 Jetson Orin Nano 开发者套件 Mac Mini M4
价格 ¥4,999 ¥4,999(仅板卡,不含 SSD 机箱) ¥4,799(16GB 版)
AI 算力 100 TOPS 67 TOPS 38 TOPS (ANE)
内存 16GB 统一 8GB 16GB 统一
软件生态 CUDA + OpenClaw 预装 JetPack SDK(裸机) Core ML(非 CUDA)
功耗 10-25W 7-15W 15-40W
大模型部署 Ollama 开箱可用 需自行配置 mlx-llm(非标准工具链)
多 Agent 协同 ✅ OpenClaw 原生 ❌ 无内置方案 ❌ 无内置方案

Mac Mini M4 的 CPU 性能更强(适合编译、视频剪辑等通用任务),但在大模型推理和 Agent 编排场景下,D1 的 CUDA 生态 + OpenClaw 预装是压倒性优势。


五、总结

D1 不是最强大的铠盒产品——那显然是 G1。但它是最"聪明"的产品:精准卡在本地大模型的入门价位,不多给不必要的算力,不少给关键的 AI 能力。

4999 元买到的是: - 一台能用 CUDA 生态跑 7B-14B 模型的设备 - 一套预装的 OpenClaw Agent 操作系统 - 一个 24 小时运转、不发热、没噪音的 AI 节点

如果你在 7 款铠盒产品中犹豫,我的建议很简单: - 只需云端 API → A1(¥999) - 想入门本地模型但预算有限 → D1(¥4,999) - 要做正经的本地部署 → E1(十余元,999) - 这是你的生产工具 → G1(¥34,999)

D1 就是那道让你迈过"本地 AI"门槛的最佳阶梯。


tags: 铠盒D1, NVIDIA Jetson Orin NX, 本地大模型, 产品评测, AI边缘计算, Ollama, OpenClaw

© KAIHE AI - Agent Computer Specialist