铠盒本地AI开发环境搭建指南:Python/Jupyter/vLLM一条龙
买了一台铠盒A1,接下来怎么把它变成AI开发工作站?如果你是刚入门的AI开发者,或者之前一直在云端玩模型、第一次碰本地部署,这篇指南帮你从零搭起完整环境,少踩80%的坑。
开箱之后第一件事不是急着装库,是检查基础环境。用铠盒自带的系统信息面板确认三样东西:ROCm驱动版本(大模型推理的前提)、可用显存和共享内存(决定你能跑多大模型)、CUDA兼容层状态(别看铠盒用AMD方案,兼容层让cuBLA、cuFFT这些CUDA库也能跑)。驱动版本建议不追最新,用官方推荐的那个稳定版,你自己手动升了大概率跑不起来。别问我怎么知道的。
搭开发环境用Miniconda最省心。装完之后先建一个独立环境,不要污染base。关键库按这个顺序装:pytorch(ROCm版本,不是CUDA版本)、transformers、vLLM。顺序很重要,torch装了再装vLLM,反过来因果倒置vLLM依赖检测不到正确的torch版本。vLLM是本地推理的核心;Ollama虽然更简单,但vLLM支持PagedAttention让KV缓存连续不碎片化,同模型能跑30%以上的并发吞吐量。
Jupyter环境用JupyterLab,比传统Notebook好用太多。装完之后配置远程访问——你不用接显示器,用笔记本浏览器连铠盒就行。启动方法:jupyter lab --ip 0.0.0.0 --port 8888 --no-browser。但注意IP绑定到0.0.0.0之后任何同一网络的人都能访问,至少设个密码或者token。开发环境的网络策略我建议不要直接暴露到公网,用内网或VPN连。
开发辅助工具链我帮你精简到四样必装:uv(Python包管理,比pip快10倍)、mise(多语言版本管理,免得Node和Python版本冲突)、code-server(浏览器里的VS Code,跟JupyterLab搭配用)、Oh My Zsh(终端体验提升)。这四件套搭好了,你的铠盒开发体验跟Mac上开发基本没有区别。
环境验证分三步测:第一步跑个7B模型看看推理正常不正常,第二步跑个embedding模型做向量化看内存占用,第三步压力测试——同时开三个推理任务看vLLM的并发表现。三步都跑通,你的开发环境就稳了。
最后记一个关键点:不要在一个环境里同时装Ollama和vLLM。两者端口冲突且共享GPU资源的方式不同,同时运行大概率OOM。选vLLM做生产推理,Ollama留着做快速原型验证就够了。