Herdsman（牧马人）：Ollama 模型的 Web 驾驶舱

Herdsman（牧马人）是什么

一句话：Ollama 模型的 Web 管理面板。浏览模型库、拉取模型、查看显存占用、测试推理——全在一个漂亮的暗色界面里。

说白了，Ollama 本身只有命令行，模型列表、搜索、管理都比较原始。Herdsman 给 Ollama 装了个图形化"驾驶舱"。

为什么需要它

用过 Ollama 的人都懂这个痛点：

想知道 Ollama 模型库里有哪些模型？只能去官网翻
想看看本地拉了哪些模型、占了多少显存？敲命令 ollama list + ollama ps
想试一个模型的效果？先 ollama pull 再 ollama run

都不是不能用，但体验确实粗糙。Herdsman 把这些全图形化了。

核心功能

📦 模型库浏览器 — 在 UI 里直接搜索和浏览 Ollama 官方模型库，不用去网页翻。看到感兴趣的模型，点一下就能拉到本地。

📋 本地模型管理 — 列出所有已下载的模型，查看详情、删除、拉取新版本。

⬇️ 下载队列 — 批量拉取模型时的顺序队列，SSE 实时显示进度。

🧠 显存估算 — 根据参数量和量化级别估算显存占用。比如 7B 模型 Q4_K_M 量化大概 4.5GB，FP16 要 15GB。一目了然。

📊 运行监控 — 查看当前加载了哪些模型、各占多少显存。可以单个卸载或全部清空。

💬 测试提示词 — 直接在 Dashboard 里给任何本地模型发提示词测试效果，不用切命令行。

显存估算对照

Herdsman 内置了一个实用的参数量估算表：

FP16 → 2.0 字节/参数 → 7B 模型约 15GB
Q8_0 → 1.0 → 8GB
Q6_K → 0.75 → 6.3GB
Q5_K_M → 0.625 → 5.4GB
Q4_K_M → 0.5 → 4.5GB
Q2_K → 0.25 → 2.8GB

在设置里填上你的总显存，浏览模型时就会显示是否装得下。

怎么部署

Docker 一键启动：

docker run -d \
  --name herdsman \
  -p 4200:80 \
  -e HERDSMAN_OLLAMA_HOST=http://host.docker.internal:11434 \
  -e HERDSMAN_ADMIN_PASSWORD=change-me \
  skydiverookie/herdsman:latest

打开 http://localhost:4200，默认账号 admin / admin。

也支持 Docker Compose 和源码构建。

技术栈

后端：Python 3.12 + FastAPI（异步）
前端：Angular 21 + Angular Material
数据库：SQLite
认证：JWT
容器：单镜像（nginx + uvicorn + supervisord）

我的看法

Herdsman 解决的问题很聚焦——Ollama 缺一个好用的图形界面。

它不是一个"AI 工具"，而是一个"AI 工具的管理工具"。如果你主要在本地跑 Ollama 模型，经常需要拉新模型、测效果、看显存占用，那 Herdsman 能省不少事。

界面风格简洁暗色，看了挺舒服。部署也简单，一行 Docker 命令的事。

Herdsman（牧马人）：Ollama 模型的 Web 驾驶舱

Herdsman（牧马人）是什么

为什么需要它

核心功能

显存估算对照

怎么部署

技术栈

我的看法

💬 评论区（0 条评论）

📤 分享这篇文章

📌 相关推荐

Open Science：开源 AI 科研工作台，Claude Science 替代品

HelixDB：图+向量一体数据库，Rust 自研 5.6K⭐，AI 应用首选

LightRAG：37K⭐ 轻量图 RAG 框架，比 GraphRAG 快 2 倍

Open Lovable：开源免费 AI 对话式 React 应用构建工具

ToolJet：开源低代码平台，38K Stars 的内部工具神器

Zvec：阿里开源10.3K Stars的进程内向量数据库，v0.5.0支持全文搜索+混合检索

Herdsman（牧马人）是什么

为什么需要它

核心功能

显存估算对照

怎么部署

技术栈

我的看法

💬 评论区 （0 条评论）

📤 分享这篇文章

📌 相关推荐

Open Science：开源 AI 科研工作台，Claude Science 替代品

HelixDB：图+向量一体数据库，Rust 自研 5.6K⭐，AI 应用首选

LightRAG：37K⭐ 轻量图 RAG 框架，比 GraphRAG 快 2 倍

Open Lovable：开源免费 AI 对话式 React 应用构建工具

ToolJet：开源低代码平台，38K Stars 的内部工具神器

Zvec：阿里开源10.3K Stars的进程内向量数据库，v0.5.0支持全文搜索+混合检索

微信扫码分享

📬 意见反馈

💬 评论区（0 条评论）