智绘、视频、音频功能指南

通过集成 SiliconFlow 平台的多模态模型,PIGX 支持文生图、图生图、语音生成和视频生成等 AI 功能。本指南将帮助你快速配置和使用这些功能。

准备工作

注册 SiliconFlow 平台

访问 SiliconFlow 平台 完成注册,并获取 API Key。

SiliconFlow 平台注册界面
API Key 管理

建议将 API Key 保存在安全的地方,避免泄露。后续配置模型时需要使用该密钥。

文生图、图生图

配置步骤

在模型配置中选择 Kwai-Kolors/Kolors 模型。

文生图模型配置界面
模型说明

Kolors 模型支持文本生成图片和图片生成图片两种模式,适用于创意设计和内容生成场景。

语音生成

配置步骤

在模型配置中选择 RVC-Boss/GPT-SoVITS 模型。

语音生成模型配置界面
模型说明

GPT-SoVITS 是一个强大的语音合成模型,支持多语言和多音色的语音生成。

视频生成

配置步骤

在模型配置中选择 Wan-AI/Wan2.1-I2V-14B-720P-Turbo 模型。

视频生成模型配置界面
异步处理机制

视频生成采用异步处理机制,提交任务后系统需要约 10 分钟进行渲染。请耐心等待,避免频繁刷新影响系统性能。

功能使用

配置完成后,在 AI 视觉功能模块中选择对应的功能即可开始使用。

AI 视觉功能界面
功能入口

所有 AI 视觉功能统一在 AI 视觉功能模块中管理,包括文生图、图生图、语音生成和视频生成。

特别模型:Nano Banana 生图

什么是 OpenRouter

OpenRouter 是一个 AI 模型 API 聚合平台,为开发者提供统一接口访问超过 400 个 AI 模型。通过 OpenRouter,你可以使用单一 API 端点调用 GPT-4、Claude、Google Gemini、Llama 等主流大型语言模型,无需为每个模型单独集成不同的 SDK。

平台优势

OpenRouter 就像 AI 模型的路由器,帮你管理和调度不同的 AI 服务提供商,让你专注于应用开发本身。

新增模型配置

新增 Nano Banana 模型配置界面

模型名称: google/gemini-2.5-flash-image

获取 API Key

  1. 访问 OpenRouter 设置页面 创建 API Key
  2. 完成账户充值(需充值 10 美元以上才能使用 Nano Banana 等付费 API)
充值要求

OpenRouter 平台需要充值 10 美元以上才能使用 Nano Banana 等付费 API,请提前完成充值。

使用示例

Nano Banana 功能使用示例
配置完成

完成上述配置后,即可在 AI 视觉功能模块中使用 Nano Banana 模型进行图片生成。