Extraire du texte des tampons en utilisant C#

Extraire du texte des annotations de tampon

Aspose.PDF pour NET vous permet d’extraire du texte des annotations de tampon. Afin d’extraire du texte des annotations de tampon dans un PDF, les étapes suivantes peuvent être utilisées.

  1. Créez un objet de classe Document.
  2. Obtenez l’Annotation souhaitée à partir de la liste des annotations d’une page.
  3. Définissez un nouvel objet de la classe TextAbsorber.
  4. Utilisez la méthode visit de TextAbsorber pour obtenir le texte.

Le snippet de code suivant fonctionne également avec la bibliothèque Aspose.PDF.Drawing.

// For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
private static void ExtractText()
{
    // The path to the documents directory
    var dataDir = RunExamples.GetDataDir_AsposePdf_Text();

    // Open PDF document
    using (var document = new Aspose.Pdf.Document(dataDir + "ExtractStampText.pdf"))
    {
        Aspose.Pdf.Annotations.Annotation item = document.Pages[1].Annotations[1];
        if (item is Aspose.Pdf.Annotations.StampAnnotation annot)
        {
            var absorber = new Aspose.Pdf.Text.TextAbsorber();
            Aspose.Pdf.XForm appearance = annot.Appearance["N"];
            absorber.Visit(appearance);
            Console.WriteLine(absorber.Text);
        }
    }
}