OpenAI 兼容服务器使用入门
概述
Open WebUI 不仅仅适用于 OpenAI、Ollama 或 Llama.cpp —— 您可以连接 任何实现了 OpenAI 兼容 API 的服务器,无论该服务器是运行在本地还是远程。如果您想运行不同的大语言模型,或者您已经有了喜欢的后端或生态系统,这将是完美的选择。本指南将向您展示如何:
- 设置 OpenAI 兼容服务器(包含几个常用选项)
- 将其连接到 Open WebUI
- 立即开始聊天
第 1 步:选择 OpenAI 兼容服务器
有许多服务器和工具都暴露了 OpenAI 兼容的 API。以下是一些最受欢迎的选择:
- Llama.cpp: 极其高效,支持 CPU 和 GPU 运行
- Ollama: 超级易用且跨平台
- LM Studio: 适用于 Windows/Mac/Linux 的功能丰富的桌面应用
- Lemonade: 快速的基于 ONNX 的后端,具有 NPU/iGPU 加速功能
选择任何适合您工作流程的工具即可!
🍋 开始使用 Lemonade
Lemonade 是一个即插即用的、基于 ONNX 的 OpenAI 兼容服务器。以下是在 Windows 上尝试它的方法:
-
运行
Lemonade_Server_Installer.exe -
使用 Lemonade 的安装程序安装并下载模型
-
运行后,您的 API 端点将是:
http://localhost:8000/api/v0

详见 其官方文档。