行业观察:巴掌大的身躯跑70B大模型——MINIX发布英伟达Jetson Thor迷你工作站
2070 TFLOPS、128GB统一内存、双10GbE——当这些参数出现在一台不到1.5公斤的盒子里,边缘AI的叙事逻辑正在被改写。
硬件新物种:这不是PC,是"AI引擎盒"
4月23日,硬件制造商MINIX宣布推出基于NVIDIA Jetson Thor系列模组的T4000 / T5000 GenAI迷你工作站。这不是又一台"高性能迷你PC"——这是一台为本地大模型推理而生的专用计算节点。
核心配置直指AI负载:
- CPU:Arm Neoverse-V3AE(服务器级ARM架构)
- GPU:NVIDIA Blackwell架构,FP4稀疏算力高达2070 TFLOPS
- 内存:最高128GB LPDDR5X统一内存(CPU/GPU共享寻址)
- 存储:预装1TB PCIe Gen4 NVMe SSD
- 机身:139.3×131×76.8mm,总重1420g,金属+塑料机身,双涡轮风扇散热

真正让这台"盒子"与众不同的不是参数本身,而是参数背后的定位:它不跟Mac mini比跑分,不跟NUC比性价比,它唯一的KPI是——能在本地跑多大的模型。
答案是:7B到70B,全系覆盖。
为什么是"统一内存"而不是"显存+内存"?
传统PC的AI推理瓶颈,往往不在GPU算力,而在GPU和CPU之间的数据搬运开销。模型加载到显存 → 推理中间结果回传内存 → 上下文窗口越大,搬运越频繁——这就是8GB显存的笔记本跑不动大模型的真正原因。
Jetson Thor平台的128GB LPDDR5X统一内存架构,CPU和GPU共享同一个物理地址空间,消除了"显存墙"。对AI实践者来说,这意味着:
- 70B参数模型可以一次性完整加载,无需量化压缩到4-bit以下
- 大上下文窗口(128K+)推理不受显存-内存搬运限制
- 多模型并行:同一台设备同时运行embedding模型 + RAG检索引擎 + LLM推理
128GB统一内存对于本地Agent场景尤其关键。一个完整的AI智能体系统通常需要同时运行3-5个模型协作——语言模型、视觉模型、嵌入模型、重排序模型——传统架构下这意味着多GPU或多机器,而统一内存架构让这一切在巴掌大的盒子里即可完成。
双10GbE + 丰富IO:面向"AI集群化"的野心
MINIX T4000/T5000的IO设计同样透露了它的真实定位:
- 2×10GbE RJ45:不是2.5GbE,是真正的万兆网口
- Wi-Fi 6E + BT 5.3
- 2×HDMI 2.1 TMDS
- 4×USB-A 5Gbps + 1×USB-C 10Gbps
双万兆网口的配置,在消费级设备中极为罕见,但在边缘计算节点中是标配。它的目标场景不是接显示器当桌面机——而是以集群形态部署:
- 3台T5000组成本地推理集群,通过10GbE直连,负载均衡分配不同规格的模型请求
- 企业内网部署,所有推理数据不出机房,满足金融、医疗、政务的合规要求
- 工厂/实验室边缘节点,低延迟本地推理,离线也能工作

从"云端API"到"桌面盒子":算力下沉的临界点
MINIX这款产品的发布,踩在了一个重要的产业节点上。
2026年Q1,DeepSeek V4的开源、Llama 4的发布、以及全球范围内企业对数据主权的重视,正在催生一个全新的需求层:不是"用不用AI",而是"AI跑在哪"。
当企业SOP(标准作业程序)文档涉及商业机密、医疗机构患者数据受法律保护、律所案卷不能离开内网——云端API再便宜也是"禁区"。本地推理,从可选项变成了必选项。
而传统本地推理的硬件选型一直面临尴尬:
| 方案 | 算力 | 成本 | 痛点 |
|---|---|---|---|
| 消费级PC + 高端GPU | 充足 | ¥20K+ | 体积大、功耗高、不是为7×24设计的 |
| 云GPU租用 | 弹性 | 按量付费 | 数据出境风险、延迟不可控 |
| Mac Studio | 尚可 | ¥30K+ | 封闭生态、模型适配成本高 |
| MINIX T5000 | 2070 TFLOPS | 待公布 | 专为AI设计、企业级IO、开箱即用 |
这是"AI推理专用机"品类的第一次完整亮相——不是PC的替代品,而是一个新物种。
铠盒视角:本地AI基础设施的"最后一公里"
MINIX的Jetson Thor迷你工作站,本质上是把"数据中心级AI算力"压缩到了桌面尺寸。这恰好与铠盒AI-BOX的产品哲学共振:让AI在本地运行,不是妥协,是进化。
两者互补关系清晰:
- MINIX = 高性能AI推理引擎(2000+ TFLOPS,适合大模型训练/微调/高并发推理)
- 铠盒AI-BOX = 开箱即用的智能体计算机(预装OpenClaw系统,零配置启动AI智能体,覆盖日常办公、内容创作、知识管理)
对于企业用户,一个典型部署拓扑可能是:
T5000 集群作为后台推理引擎 → 铠盒AI-BOX作为前端智能体工作站 → 员工通过网页/API以自然语言调用AI能力,数据全程不出企业内网
当算力硬件(如MINIX T5000)和智能体操作系统(如OpenClaw)同时走向成熟,"本地AI"不再意味着"低配版AI"——它意味着完全可控、无限调用、零Token费的AI基础设施。
结语
2070 TFLOPS塞进1400克——这不是技术的终点,而是边缘AI新纪元的起点。
MINIX T4000/T5000系列的发布传递了一个清晰信号:大模型的部署主场,正在从数据中心向企业本地、工厂边缘、甚至个人桌面迁移。当AI算力像Wi-Fi路由器一样接入即可用,所有关于"数据安全""推理成本""响应延迟"的顾虑,都不再是选择题——它们将被硬件层面的进步一揽子解决。
价格尚未公布,但这款产品的真正价值不在价格标签上。它在问这个行业一个问题:当70B大模型能在你的办公桌上安静运行时,你的业务逻辑会如何重构?