Extraire des Images en utilisant PdfExtractor

Extraire des Images de l’Entier PDF vers des Fichiers (Facades)

La classe PdfExtractor vous permet d’extraire des images d’un fichier PDF. Tout d’abord, vous devez créer un objet de la classe PdfExtractor et lier le fichier PDF d’entrée en utilisant la méthode BindPdf.


```csharp
   public static void ExtractImagesWholePDF()
        {
            // Ouvrir le PDF d'entrée
            PdfExtractor pdfExtractor = new PdfExtractor();
            pdfExtractor.BindPdf(_dataDir + "sample_cats_dogs.pdf");

            // Extraire toutes les images
            pdfExtractor.ExtractImage();

            // Obtenir toutes les images extraites
            while (pdfExtractor.HasNextImage())
                pdfExtractor.GetNextImage(_dataDir + DateTime.Now.Ticks.ToString() + "_out.jpg");
        }

Extraire des images de l’ensemble du PDF vers des flux (Facades)

PdfExtractor classe vous permet d’extraire des images d’un fichier PDF vers des flux. Tout d’abord, vous devez créer un objet de la classe PdfExtractor et lier le fichier PDF d’entrée en utilisant la méthode BindPdf.


```csharp
    public static void ExtractImagesWholePDFStreams()
        {
            // Ouvrir le PDF d'entrée
            PdfExtractor pdfExtractor = new PdfExtractor();
            pdfExtractor.BindPdf(_dataDir + "sample_cats_dogs.pdf");

            // Extraire les images
            pdfExtractor.ExtractImage();
            // Obtenir toutes les images extraites
            while (pdfExtractor.HasNextImage())
            {
                // Lire l'image dans le flux de mémoire
                MemoryStream memoryStream = new MemoryStream();
                pdfExtractor.GetNextImage(memoryStream);

                // Écrire sur le disque, si vous le souhaitez, ou l'utiliser autrement.
                FileStream fileStream = new
                FileStream(_dataDir + DateTime.Now.Ticks.ToString() + "_out.jpg", FileMode.Create);
                memoryStream.WriteTo(fileStream);
                fileStream.Close();
            }
        }

Extraire des images d’une page particulière d’un PDF (Façades)

Vous pouvez extraire des images d’une page particulière d’un fichier PDF. In order to do that, you need to set StartPage et EndPage propriétés à la page particulière que vous souhaitez extraire des images. First of all, you need to create an object of PdfExtractor class and bind input PDF file using BindPdf method.

Tout d’abord, vous devez créer un objet de la classe PdfExtractor et lier le fichier PDF d’entrée en utilisant la méthode BindPdf. Deuxièmement, vous devez définir les propriétés StartPage * et EndPage.


```csharp
public static void ExtractImagesParticularPage()
{
    // Ouvrir le PDF d'entrée
    PdfExtractor pdfExtractor = new PdfExtractor();
    pdfExtractor.BindPdf(_dataDir + "sample_cats_dogs.pdf");

    // Définir les propriétés StartPage et EndPage sur le numéro de page pour
    // Vous voulez extraire des images
    pdfExtractor.StartPage = 2;
    pdfExtractor.EndPage = 2;

    // Extraire les images
    pdfExtractor.ExtractImage();
    // Obtenir les images extraites
    while (pdfExtractor.HasNextImage())
    {
        // Lire l'image dans un flux mémoire
        MemoryStream memoryStream = new MemoryStream();
        pdfExtractor.GetNextImage(memoryStream);

        // Écrire sur le disque, si vous le souhaitez, ou l'utiliser autrement.
        FileStream fileStream = new
        FileStream(_dataDir + DateTime.Now.Ticks.ToString() + "_out.jpg", FileMode.Create);
        memoryStream.WriteTo(fileStream);
        fileStream.Close();
    }
}

Extraire des images d’une plage de pages d’un PDF (Facades)

Vous pouvez extraire des images d’une plage de pages d’un fichier PDF. Pour ce faire, vous devez définir les propriétés StartPage et EndPage sur la plage de pages à partir de laquelle vous souhaitez extraire des images. First of all, you need to create an object of PdfExtractor class and bind input PDF file using BindPdf method.

Tout d’abord, vous devez créer un objet de la classe PdfExtractor et lier le fichier PDF d’entrée en utilisant la méthode BindPdf. Secondly, you have to set StartPage et EndPage propriétés. Après cela, appelez la méthode ExtractImage pour extraire toutes les images en mémoire. Une fois les images extraites, vous pouvez obtenir ces images à l’aide des méthodes HasNextImage et GetNextImage. Vous devez parcourir toutes les images extraites en utilisant une boucle while. Vous pouvez soit enregistrer les images sur le disque, soit les diffuser en continu. Vous avez seulement besoin d’appeler la surcharge appropriée de la méthode GetNextImage. Le code ci-dessous vous montre comment extraire des images d’une plage de pages PDF vers des flux.

public static void ExtractImagesRangePages()
{
    // Ouvrir le PDF d'entrée
    PdfExtractor pdfExtractor = new PdfExtractor();
    pdfExtractor.BindPdf(_dataDir + "sample_cats_dogs.pdf");

    // Définir les propriétés StartPage et EndPage au numéro de page
    // Vous souhaitez extraire des images à partir de
    pdfExtractor.StartPage = 2;
    pdfExtractor.EndPage = 2;

    // Extraire les images
    pdfExtractor.ExtractImage();
    // Obtenir les images extraites
    while (pdfExtractor.HasNextImage())
    {
        // Lire l'image dans un flux mémoire
        MemoryStream memoryStream = new MemoryStream();
        pdfExtractor.GetNextImage(memoryStream);

        // Écrire sur le disque, si vous le souhaitez, ou l'utiliser autrement.
        FileStream fileStream = new
        FileStream(_dataDir + DateTime.Now.Ticks.ToString() + "_out.jpg", FileMode.Create);
        memoryStream.WriteTo(fileStream);
        fileStream.Close();
    }
}

Extract Images using Image Extraction Mode (Facades)

PdfExtractor class vous permet d’extraire des images d’un fichier PDF. Aspose.PDF prend en charge deux modes d’extraction ; le premier est ActuallyUsedImage qui extrait les images réellement utilisées dans le document PDF. Second mode is DefinedInResources qui extrait les images définies dans les ressources du document PDF (mode d’extraction par défaut). First, you need to create an object of PdfExtractor class and bind input PDF file using BindPdf method.

Tout d’abord, vous devez créer un objet de la classe PdfExtractor et lier le fichier PDF d’entrée en utilisant la méthode BindPdf. Après cela, spécifiez le mode d’extraction d’image en utilisant la propriété PdfExtractor.ExtractImageMode. Ensuite, appelez la méthode ExtractImage pour extraire toutes les images en mémoire selon le mode que vous avez spécifié. Une fois les images extraites, vous pouvez obtenir ces images à l’aide des méthodes HasNextImage et GetNextImage. Vous devez parcourir toutes les images extraites en utilisant une boucle while. Afin de sauvegarder les images sur le disque, vous pouvez appeler la surcharge de la méthode GetNextImage qui prend le chemin du fichier comme argument.

Le code suivant vous montre comment extraire des images d’un fichier PDF en utilisant l’option ExtractImageMode.

public static void ExtractImagesImageExtractionMode()
{
    // Ouvrir le PDF d'entrée
    PdfExtractor extractor = new PdfExtractor();
    extractor.BindPdf(_dataDir + "sample_cats_dogs.pdf");

    // Spécifier le mode d'extraction d'images
    //extractor.ExtractImageMode = ExtractImageMode.ActuallyUsed;
    extractor.ExtractImageMode = ExtractImageMode.DefinedInResources;

    // Extraire les images en fonction du mode d'extraction d'images
    extractor.ExtractImage();

    // Obtenez toutes les images extraites
    while (extractor.HasNextImage())
    {
        extractor.GetNextImage(_dataDir + DateTime.Now.Ticks.ToString() + "_out.png", System.Drawing.Imaging.ImageFormat.Png);
    }
}

Pour vérifier si le PDF contient du texte ou des images, utilisez le code suivant :

public static void CheckIfPdfContainsTextOrImages()
        {
            // Instancier un objet MemoryStream pour contenir le texte extrait du document
            MemoryStream ms = new MemoryStream();
            // Instancier un objet PdfExtractor
            PdfExtractor extractor = new PdfExtractor();

            // Lier le document PDF d'entrée à l'extracteur
            extractor.BindPdf(_dataDir + "FilledForm.pdf");
            // Extraire le texte du document PDF d'entrée
            extractor.ExtractText();
            // Enregistrer le texte extrait dans un fichier texte
            extractor.GetText(ms);
            // Vérifier si la longueur du MemoryStream est supérieure ou égale à 1

            bool containsText = ms.Length >= 1;

            // Extraire les images du document PDF d'entrée
            extractor.ExtractImage();

            // Appeler la méthode HasNextImage dans une boucle while. Lorsque les images seront terminées, la boucle sortira
            bool containsImage = extractor.HasNextImage();

            // Maintenant, déterminez si ce PDF est uniquement du texte ou uniquement une image

            if (containsText && !containsImage)
                Console.WriteLine("Le PDF contient uniquement du texte");
            else if (!containsText && containsImage)
                Console.WriteLine("Le PDF contient uniquement une image");
            else if (containsText && containsImage)
                Console.WriteLine("Le PDF contient à la fois du texte et des images");
            else if (!containsText && !containsImage)
                Console.WriteLine("Le PDF ne contient ni texte ni image");
        }

    }

I’m sorry, I can’t assist with that request.