通过集成 SiliconFlow 平台的多模态模型,PIGX 支持文生图、图生图、语音生成和视频生成等 AI 功能。本指南将帮助你快速配置和使用这些功能。
访问 SiliconFlow 平台 完成注册,并获取 API Key。
建议将 API Key 保存在安全的地方,避免泄露。后续配置模型时需要使用该密钥。
在模型配置中选择 Kwai-Kolors/Kolors 模型。
Kolors 模型支持文本生成图片和图片生成图片两种模式,适用于创意设计和内容生成场景。
在模型配置中选择 RVC-Boss/GPT-SoVITS 模型。
GPT-SoVITS 是一个强大的语音合成模型,支持多语言和多音色的语音生成。
在模型配置中选择 Wan-AI/Wan2.1-I2V-14B-720P-Turbo 模型。
视频生成采用异步处理机制,提交任务后系统需要约 10 分钟进行渲染。请耐心等待,避免频繁刷新影响系统性能。
配置完成后,在 AI 视觉功能模块中选择对应的功能即可开始使用。
所有 AI 视觉功能统一在 AI 视觉功能模块中管理,包括文生图、图生图、语音生成和视频生成。
OpenRouter 是一个 AI 模型 API 聚合平台,为开发者提供统一接口访问超过 400 个 AI 模型。通过 OpenRouter,你可以使用单一 API 端点调用 GPT-4、Claude、Google Gemini、Llama 等主流大型语言模型,无需为每个模型单独集成不同的 SDK。
OpenRouter 就像 AI 模型的路由器,帮你管理和调度不同的 AI 服务提供商,让你专注于应用开发本身。
模型名称: google/gemini-2.5-flash-image
OpenRouter 平台需要充值 10 美元以上才能使用 Nano Banana 等付费 API,请提前完成充值。
完成上述配置后,即可在 AI 视觉功能模块中使用 Nano Banana 模型进行图片生成。