PDF AI 副驾驶
Aspose.PDF AI Copilot API 旨在允许用户使用来自不同提供商的 LLM 处理 PDF 文档。这个
API 将帮助用户构建聊天机器人应用程序并将 PDF 解决方案与 LLM 集成。
主要特性
- 文档摘要。
- 与文档聊天。
- 从文档中获取图像并提供描述。
示例
目前,以下 copilots 可用:
OpenAI 摘要 允许用户从文档中生成摘要。它通过配置选项(如模型、温度、令牌数量、模型指令、文档附件等)提供了一种方便的创建摘要的方式。该 copilot 可以异步生成文本、文档的摘要,并以各种格式保存摘要。提供的演示代码展示了如何创建 OpenAI 客户端、配置 copilot 选项以及使用 SummaryCopilot 生成和保存摘要。
OpenAI Chat 是一个设计用于与文档进行聊天交互的 AI copilot。它促进了对用户查询的响应生成和上下文管理。用户可以配置 copilot 选项,如模型、温度、令牌数量、模型指令、文档附件等。该 copilot 可以对单个或多个查询提供响应,保存响应为各种格式,保存和删除上下文。
提供的代码演示了如何创建 OpenAI 客户端、配置 ChatCopilot 选项以及使用 ChatCopilot 与用户查询进行交互和管理上下文。
OpenAI Image Description 是一个设计用于生成 PDF 文档内图像以及单独图像文件的图像描述的 AI copilot。用户可以配置 copilot 选项,如模型、温度、令牌数量、模型指令、文档附件等。该 copilot 提供了一次获取所有附加文档的图像描述的能力。
提供的代码片段演示了如何创建 OpenAI 客户端、配置 ImageDescriptionCopilot 选项以及使用 copilot 获取附加文档的图像描述。此外,还有一个扩展方法,允许将图像描述添加到附加文档中的图像,并在提供的目录中保存新文档。
OpenAI OCR 是一个旨在从扫描文档和图像中提取文本的 AI copilot。用户可以配置 copilot 选项,如模型、温度、令牌数量、模型指令、文档附件等。
提供的代码片段演示了如何创建 OpenAI 客户端、配置 OpenAIOcrCopilotOptions
选项以及使用 copilot 从扫描文档和图像中获取文本。
Llama Chat 允许创建一个客户端以向 Llama 聊天完成 API 发送请求。
Llama Summary 允许客户端用于创建 Summary Copilot。