使用 Python 处理 PDF 文本
Contents
[
Hide
]
我们有时需要向 PDF 文件添加文本。例如,您可能想在主文本下方放置译文、在图像旁添加标题,或填写申请表。当所有文本元素都能以您偏好的样式进行格式化时,也会很有帮助。常见的文本操作包括在文档中添加文本、格式化文本、替换文本和旋转文本。Aspose.PDF for Python via .NET 提供了处理 PDF 文本内容所需的一切。
当您需要在 Python 应用程序中直接在 PDF 页面内生成、格式化、检查或修改文本时,请使用本节。
涉及的文本任务
您可以执行以下操作:
- 向 PDF 文件添加文本 - 向 PDF 添加文本,使用来自流和文件的字体,添加 HTML 字符串,添加超链接等。
- PDF 工具提示 - 您可以通过使用 Python 添加不可见按钮,为搜索到的文本添加工具提示。
- 使用 FloatingBox - 将样式化文本和其他内容放置在浮动容器中。
- 替换 PDF 中的文本 - 替换或删除 PDF 文件中的现有文本。
- 旋转 PDF 内的文本 - 旋转 PDF 中的文字片段和段落。
- 搜索并获取 PDF 文本 - 搜索文本并检查页面上提取的文本详细信息。
- PDF 中的文本格式化 - 控制行间距、边框、缩进和文本样式。