PIG AI 支持通过在线配置接入私有化(ollama/vllm)模型,部署前请确保满足以下基础要求:
| 模型类型 | 模型名称 | 说明 |
|---|---|---|
| 聊天模型 | qwen2.5:72b | 72b 参数量聊天模型,更准确需要更多资源 |
| 推理模型 | deepseek-r1:32b | R1 推理模型,支持复杂推理任务 |
| 向量模型 | bge-m3:latest | 用于文档向量化和语义检索 |
| 视觉模型 | qwen2.5vl:32b | 支持图像理解和多模态对话 |
Ollama 版本必须为 0.5.0 及以上才能支持本文档中介绍的所有功能特性。
如果 Ollama 服务部署在远程服务器,需要配置 OLLAMA_HOST 为 0.0.0.0 以允许外部访问。本地部署可跳过此配置。
运行 70b 模型为生产级模型,需要 GPU 80G+ 的显存,无法在普通 CPU 条件推理,模型推理速度(可以理解为提问响应速度)取决于硬件配置。
请注意配置的模型和如上 ollama 运行时模型名称一致,否则无法正常调用。
进入模型配置页面,点击"新增模型"
