Skip to main content

Mistral OCR

警告

本教程为社区贡献,不属于 Open WebUI 团队支持范围。它仅作为如何针对特定用例自定义 Open WebUI 的演示。想要贡献?请查看贡献教程。

👁️ Mistral OCR

本文档提供了一个将 Mistral OCR 集成到 Open WebUI 的分步指南。Mistral OCR 是一个光学字符识别库,旨在从各种基于图像的文件格式(包括扫描的 PDF、图像和手写文档)中提取文本,并将其转换为 JSON 或纯文本等结构化数据。凭借对多语言文本识别、布局分析和手写解读的先进支持,Mistral OCR 简化了 AI 应用(如搜索、总结和数据提取)的文档数字化和处理过程,所有这些都通过一个稳健且可定制的接口实现。

前提条件

  • Open WebUI 实例
  • Mistral AI 账号

集成步骤

第 1 步:注册或登录 Mistral AI 控制台

  • 访问 https://console.mistral.ai
  • 按照流程中的说明进行操作
  • 授权成功后,您将进入控制台首页

第 2 步:生成 API 密钥

  • 前往 API Keyshttps://console.mistral.ai/api-keys
  • 创建一个新密钥并确保已复制它

第 3 步:配置 Open WebUI 使用 Mistral OCR

  • 登录您的 Open WebUI 实例。
  • 导航至 管理员面板 设置菜单。
  • 点击 设置
  • 点击 文档 选项卡。
  • 默认 内容提取引擎下拉菜单更改为 Mistral OCR
  • 在字段中粘贴 API 密钥。
  • 保存管理员面板设置。

验证 Mistral OCR

要通过脚本验证 Mistral OCR 是否正常工作,请参考 https://docs.mistral.ai/capabilities/document/

结论

将 Mistral OCR 与 Open WebUI 集成是增强文档处理和内容提取能力的简单且有效的方法。通过遵循本指南中的步骤,您可以将 Mistral OCR 设置为默认提取引擎,并利用其先进的文本识别功能。配置完成后,Mistral OCR 将支持强大的多语言文档解析和各种格式,从而增强 Open WebUI 中由 AI 驱动的文档分析能力。