使用 Python 编程裁剪 PDF 页面

获取页面属性

PDF 文件中的每个页面都有许多属性,例如宽度、高度、出血框、裁剪框和裁切框。Aspose.PDF for Python 允许您访问这些属性。

  • media_box: 媒体框是最大的页面框。它对应于打印到 PostScript 或 PDF 时选择的页面大小(例如 A4、A5、US Letter 等)。换句话说,媒体框决定了显示或打印 PDF 文档的介质的物理大小。
  • bleed_box: 如果文档有出血,PDF 也会有一个出血框。出血是超出页面边缘的颜色(或艺术品)的量。它用于确保当文档打印并裁切到尺寸(“裁切”)时,墨水会一直延伸到页面边缘。即使页面被错剪 - 稍微偏离裁切标记 - 页面上也不会出现白边。
  • trim_box: 裁切框指示文档在打印和裁切后的最终尺寸。
  • art_box: 艺术框是在文档中绘制在页面实际内容周围的框。 此页面框用于在其他应用程序中导入PDF文档。
  • crop_box: 裁剪框是您的PDF文档在Adobe Acrobat中显示的“页面”大小。在正常视图中,Adobe Acrobat中只显示裁剪框的内容。有关这些属性的详细描述,请阅读Adobe.Pdf规格,特别是10.10.1页面边界。

下面的代码片段展示了如何裁剪页面:


    import aspose.pdf as ap

    document = ap.Document(input_pdf)

    # 创建新的Box矩形
    new_box = ap.Rectangle(200, 220, 2170, 1520, True)
    document.pages[1].crop_box = new_box
    document.pages[1].trim_box = new_box
    document.pages[1].art_box = new_box
    document.pages[1].bleed_box = new_box

    document.save(output_pdf)

在此示例中,我们使用了一个示例文件这里。最初,我们的页面看起来如图1所示。
图1. 裁剪后的页面

更改后,页面将如图2所示。 图2. 裁剪页面