零基础部署指南:如何在你自己的硬件上跑一个大模型

Published on: 2026-04-28

技术教程型|零基础部署指南:如何在你自己的硬件上跑一个大模型

分类: 技术教程 · 新手入门
关键词: 大模型本地部署、Ollama教程、部署开源大模型、边缘计算入门
目标读者: 无AI工程经验的IT人员、想自学本地AI的开发者、技术好奇心强的职场人


前言:为什么你应该学会这个技能?

2026年了。

如果你是一个后端开发、运维、IT管理员、或者只是对AI有强烈好奇心——在自己硬件上跑一个大模型已经是一个堪比"会写SQL"的基础技能。

因为:

  • 会这个技能 = 不吃云API商的亏(你懂了才知道哪家贵、哪家不值)
  • 会这个技能 = 面试加分项(越来越多的公司要内部落地AI了)
  • 会这个技能 = 真正的AI理解(用ChatGPT网页和跑本地模型是完全不同的认知层级)

好消息是:零基础也能上手,一小时内搞定。

坏消息是:市面上的教程,要么过于硬核劝退人,要么过于简单只教了皮毛。

这篇,我们走中间路线——从零开始,用最直白的方式,带你完成"本地跑大模型"的全流程。


一、准备清单(先看看你需要什么)

硬件要求

你想跑的模型大小 最少内存 推荐配置 能干嘛
2B-3B参数(轻量) 8GB 16GB 简单问答、文本摘要、分类任务
7B-8B参数(主流) 16GB 32GB 日常办公助手、代码辅助、翻译
13B-14B参数(进阶) 32GB 64GB + GPU 复杂推理、专业领域、高质量长文

💡 实用建议: 90%的个人和企业场景,7B-8B模型完全够用。别被"参数越大越好"这种东西忽悠了——大模型慢、贵、调起来麻烦,你大概率用不上。

如果你是团队使用,推荐一台专用的AI边缘计算设备(比如铠盒AI Box),配置已经调优过,插电即用,比你自己攒机省心太多。

软件准备

我们要用的三件套(全部免费开源):

  1. Ollama — 模型运行引擎(负责下载和运行模型,类似"模型界的Docker")
  2. Open WebUI — 网页版交互界面(和ChatGPT一样的体验,但后端是你自己的机器)
  3. Docker — 容器化运行环境(让Open WebUI跑在隔离环境中,装一次永久用)

二、实操步骤(一步步来,别跳)

步骤1:安装 Ollama

Windows:ollama.com/download 下载安装包 → 双击 → 一路Next → 完成。

Mac: 同上。

Linux:

curl -fsSL https://ollama.com/install.sh | sh

安装完成后,打开终端/PowerShell,验证一下:

ollama --version

看到版本号就成功了。


步骤2:下载你的第一个模型

推荐从 Llama 3 入手(Meta官方开源,中文英文都行):

ollama pull llama3:8b

开始下载(约4.7GB,视网速等几分钟到十几分钟)。

🔁 备选模型推荐: - 中文场景为主 → ollama pull qwen2:7b(阿里通义千问开源版,中文最强之一) - 写代码为主 → ollama pull deepseek-coder-v2(DeepSeek代码模型) - 想体验最强开源 → ollama pull deepseek-v3(但要求高配置)

下载好之后,直接试一下:

ollama run llama3:8b

出现 >>> 提示符,就说明模型在跑了。输入问题试试。


步骤3:装个漂亮的Web界面(Open WebUI)

终端里敲命令太原始了。一个正经的Web界面是你的尊严。

首先装 Docker:docker.com 下载 Docker Desktop → 安装 → 启动。

然后用一行命令启动 Open WebUI:

docker run -d -p 3000:8080 \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:main

等半分钟,浏览器打开 http://localhost:3000 ——

你会看到一个和 ChatGPT 体验几乎一样的界面,但后端服务跑在你自己机器上,不联网也能用


步骤4:创建账号,开始使用

第一次登录 Open WebUI,会提示你创建管理员账号(这是本地的,不会联网注册)。

创建好之后,左上角选择你下载好的模型(如 llama3:8b),就可以开始聊天了。


三、进阶:让你的AI更懂你的业务

现在你能本地跑模型了。但这只是60分——基础功能。

80分以上的水平,是让模型理解你的业务

3.1 上传你的文档做知识库

Open WebUI 支持 RAG(检索增强生成)——直白说就是:

把你们的公司手册、产品说明、技术文档、客服话术塞进去,AI回答时自动查这些资料。

操作路径:左上角 Documents → 上传PDF/TXT/MD → 提问时勾选"Search Documents"。

举个例子: 你是做To B销售的,把你们的产品参数表、竞品对比表、报价单传进去。下次客户问"你们和某某品牌比有什么优势",AI直接翻你的资料回答,不用你现编。

3.2 设系统提示词(System Prompt)

这个功能堪称"AI调教神器"。

在 Open WebUI 的 Settings → System Prompt 里,写下你的AI应该遵守的规则:

你是一个专业的IT技术支持顾问,服务于中小企业客户。
用简洁、不装逼的语言回答。不使用缩写,不假设对方知道术语。
每当你推荐任何配置或方案时,同时给出"为什么选这个"的理由。

保存后,你的AI从此就是你的形状。不再复读机,不再答非所问。


四、常见问题快速排雷

Q:为什么回答特别慢?

A: ① 模型太大,硬件吃不消 → 换7B或3B模型 ② 没用GPU加速 → 你的机器如果有显卡,Ollama通常自动检测并使用

Q:Ollama下载模型失败了?

A: 网络问题,开代理(你懂的)或者换国内镜像源。或者直接用铠盒AI Box——出厂预装好了,不用你折腾网络。

Q:断电了模型还在吗?

A: 在。Ollama下载的模型存在本地硬盘(Windows默认在 C:\Users\你的用户名\.ollama ),不删永远在。

Q:我能不能同时跑多个模型?

A: 可以,但看内存够不够。同时跑两个7B模型,建议32GB以上内存。


五、写在最后:学完这一步,你比90%的人更懂AI

这篇教程覆盖了: - ✅ 选型(你知道7B和13B的区别) - ✅ 部署(你能在本地把模型跑起来) - ✅ UI(你有Web界面了) - ✅ RAG(你能让AI读你的业务文档) - ✅ 调教(你会设System Prompt改变AI行为)

这些能力,在你公司下次讨论"我们要不要上AI"的时候——你就是那个能动手做的人,而不是那个只能听懂一半的人。


📌 不想从头自己折腾硬件和软件?铠盒 AI Box 系列 出厂预装 Ollama + Open WebUI,插电即用,5分钟上手。点击 nizwo.com 了解详情。

© KAIHE AI - Agent Computer Specialist