Extraer Imágenes de PDF
Contents
[
Hide
]
Cada página en un documento PDF contiene recursos (imágenes, formularios y fuentes). Podemos acceder a estos recursos llamando al método getResources. La clase Resources contiene XImageCollection y podemos obtener una lista de imágenes llamando al método getImages.
Así que para extraer una imagen de una página, necesitamos obtener referencia a la página, luego a los recursos de la página y finalmente a la colección de imágenes. Podemos extraer una imagen particular, por ejemplo, por índice.
El índice de la imagen retorna un objeto XImage. This object provides a save method which can be used to save the extracted image. The following code snippet shows how to extract images from a PDF file.
// Cargar el documento PDF
$document = new Document($inputFile);
// Obtener la primera página del documento
$page = $document->getPages()->get_Item(1);
// Obtener la colección de imágenes en la página
$xImageCollection = $page->getResources()->getImages();
// Obtener la primera imagen de la colección
$xImage = $xImageCollection->get_Item(1);
// Crear un nuevo objeto FileOutputStream para guardar la imagen
$outputImage = new java("java.io.FileOutputStream", $outputFile);
// Guardar la imagen en el archivo de salida
$xImage->save($outputImage);
// Cerrar el archivo de imagen de salida
$outputImage->close();