Skip to main content

配置

Open WebUI 支持本地、浏览器和远程语音转文本 (STT)。

alt text

alt text

云端 / 远程语音转文本提供商

目前支持以下云端语音转文本提供商。API 密钥可以配置为环境变量 (OpenAI) 或在管理员设置页面中配置(两种密钥均可)。

服务是否需要 API 密钥
OpenAI
DeepGram

WebAPI 通过内置的浏览器 STT 提供商提供语音转文本功能。

配置您的 STT 提供商

要配置语音转文本提供商:

  • 导航到 管理员设置
  • 选择 音频
  • 提供 API 密钥并从下拉列表中选择模型

alt text

用户级设置

除了在管理员面板中配置的实例设置外,还有一些用户级设置可以提供额外功能。

  • STT 设置: 包含与语音转文本功能相关的设置。
  • 语音转文本引擎: 决定用于语音识别的引擎(默认或 Web API)。

alt text

使用 STT

语音转文本提供了一种高效的语音输入提示词方式,在桌面和移动设备上都能稳定运行。

要使用 STT,只需点击麦克风图标:

alt text

实时音频波形将指示语音捕获成功:

alt text

STT 模式操作

开始录音后,您可以:

  • 点击 勾选图标 保存录音(如果启用了完成后自动发送,它将发送以生成回复;否则您可以手动发送)
  • 如果您想中止录音(例如,您想重新开始录音),可以点击 'x' 图标 退出录音界面

alt text