语音识别功能指南

模型名称: FunAudioLLM/SenseVoiceSmall
API Key: 填入从 siliconflow 平台获取的密钥
模型类型: 选择&quot;语音识别&quot;
基础地址: <a href="https://api.siliconflow.cn/v1" rel="noopener noreferrer" target="_blank" class="link_a7cea link_a9ef4 inline-link_f855c">https://api.siliconflow.cn/v1

准备工作

在 PIGX 管理后台进入 AI 模型管理页面,添加 SenseVoiceSmall 语音识别模型配置:

配置参数说明:

HTTPS 协议要求

站点发布必须启用 HTTPS。引入语音录制功能需要依赖浏览器的 HTML5 接口,浏览器对录音功能的限制要求页面必须在 HTTPS 协议下运行。

配置完成后,在 AI 对话界面点击麦克风图标即可开始语音输入:

识别效果

支持中文、英文等 50+ 种语言,识别准确率高,支持情感识别和声学事件检测。

本页目录