Удалить все изображения из PDF

Contents
[ ]

PDF‑документы часто содержат изображения для иллюстраций, брендинга или декора. Может возникнуть необходимость удалить все изображения из PDF, например, чтобы уменьшить размер файла, защитить конфиденциальные визуальные материалы или подготовить версию только с текстом.

Используя PdfContentEditor, вы можете программно удалить все изображения из PDF, обеспечивая, что документ содержит только текстовое содержимое. В этом примере привязывается входной PDF, удаляются все изображения и сохраняется изменённый файл.

  1. Создайте объект PdfContentEditor.
  2. Привяжите входной PDF.
  3. Удалите все изображения.
  4. Сохраните обновлённый Document.
import aspose.pdf.facades as pdf_facades
import sys
from os import path

sys.path.append(path.join(path.dirname(__file__), ".."))

from config import set_license, initialize_data_dir


def delete_all_image(infile, outfile):
    # Create PdfContentEditor object
    content_editor = pdf_facades.PdfContentEditor()
    # Bind document to PdfContentEditor
    content_editor.bind_pdf(infile)
    # Delete all images from the document
    content_editor.delete_image()
    # Save updated document
    content_editor.save(outfile)