智绘、视频、音频功能指南

通过集成 SiliconFlow 平台的多模态模型,PIGX 支持文生图、图生图、语音生成和视频生成等 AI 功能。本指南将帮助你快速配置和使用这些功能。

准备工作

注册 SiliconFlow 平台

访问 SiliconFlow 平台完成注册,并获取 API Key。

API Key 管理

建议将 API Key 保存在安全的地方,避免泄露。后续配置模型时需要使用该密钥。

文生图、图生图

配置步骤

在模型配置中选择 Kwai-Kolors/Kolors 模型。

模型说明

Kolors 模型支持文本生成图片和图片生成图片两种模式,适用于创意设计和内容生成场景。

语音生成

配置步骤

在模型配置中选择 RVC-Boss/GPT-SoVITS 模型。

模型说明

GPT-SoVITS 是一个强大的语音合成模型,支持多语言和多音色的语音生成。

视频生成

配置步骤

在模型配置中选择 Wan-AI/Wan2.1-I2V-14B-720P-Turbo 模型。

异步处理机制

视频生成采用异步处理机制,提交任务后系统需要约 10 分钟进行渲染。请耐心等待,避免频繁刷新影响系统性能。

功能使用

配置完成后,在 AI 视觉功能模块中选择对应的功能即可开始使用。

功能入口

所有 AI 视觉功能统一在 AI 视觉功能模块中管理,包括文生图、图生图、语音生成和视频生成。

特别模型:Nano Banana 生图

什么是 OpenRouter

OpenRouter 是一个 AI 模型 API 聚合平台,为开发者提供统一接口访问超过 400 个 AI 模型。通过 OpenRouter,你可以使用单一 API 端点调用 GPT-4、Claude、Google Gemini、Llama 等主流大型语言模型,无需为每个模型单独集成不同的 SDK。

平台优势

OpenRouter 就像 AI 模型的路由器,帮你管理和调度不同的 AI 服务提供商,让你专注于应用开发本身。

新增模型配置

模型名称: google/gemini-2.5-flash-image

获取 API Key

访问 OpenRouter 设置页面创建 API Key
完成账户充值(需充值 10 美元以上才能使用 Nano Banana 等付费 API)

充值要求

OpenRouter 平台需要充值 10 美元以上才能使用 Nano Banana 等付费 API,请提前完成充值。

使用示例

配置完成

完成上述配置后,即可在 AI 视觉功能模块中使用 Nano Banana 模型进行图片生成。

本页目录

#智绘、视频、音频功能指南

#准备工作

#注册 SiliconFlow 平台

#文生图、图生图

#配置步骤

#语音生成

#配置步骤

#视频生成

#配置步骤

#功能使用

#特别模型:Nano Banana 生图

#什么是 OpenRouter

#新增模型配置

#获取 API Key

#使用示例

智绘、视频、音频功能指南

准备工作

注册 SiliconFlow 平台

文生图、图生图

配置步骤

语音生成

配置步骤

视频生成

配置步骤

功能使用

特别模型:Nano Banana 生图

什么是 OpenRouter

新增模型配置

获取 API Key

使用示例