Извлечение изображений из PDF файла с использованием Python

Вам нужно извлечь изображения из ваших PDF файлов? Для упрощенного управления, архивирования, анализа или обмена изображениями ваших документов используйте Aspose.PDF for Python и извлекайте изображения из PDF файлов.

Изображения хранятся в ресурсах каждой страницы в коллекции XImage. Чтобы извлечь изображение с определенной страницы, получите изображение из коллекции Images, используя индекс конкретного изображения.

Индекс изображения возвращает объект XImage. Этот объект предоставляет метод save(), который может быть использован для сохранения извлеченного изображения. Следующий фрагмент кода показывает, как извлекать изображения из PDF файла.


    import aspose.pdf as ap

    # Открыть документ
    document = ap.Document(input_file)

    # Извлечь конкретное изображение
    xImage = document.pages[2].resources.images[1]
    outputImage = io.FileIO(output_image, "w")

    # Сохранить извлеченное изображение
    xImage.save(outputImage)
    outputImage.close()

Удаление изображений из PDF файла с использованием Python