Extraer texto de sellos usando C#

Extraer texto de anotaciones de sello

Aspose.PDF para NET te permite extraer texto de anotaciones de sello. Para extraer texto de anotaciones de sello en un PDF, se pueden utilizar los siguientes pasos.

  1. Crea un objeto de la clase Document.
  2. Obtén la Annotation deseada de la lista de anotaciones de una página.
  3. Define un nuevo objeto de la clase TextAbsorber.
  4. Utiliza el método visit de TextAbsorber para obtener el texto.

El siguiente fragmento de código también funciona con la biblioteca Aspose.PDF.Drawing.

// For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
private static void ExtractText()
{
    // The path to the documents directory
    var dataDir = RunExamples.GetDataDir_AsposePdf_Text();

    // Open PDF document
    using (var document = new Aspose.Pdf.Document(dataDir + "ExtractStampText.pdf"))
    {
        Aspose.Pdf.Annotations.Annotation item = document.Pages[1].Annotations[1];
        if (item is Aspose.Pdf.Annotations.StampAnnotation annot)
        {
            var absorber = new Aspose.Pdf.Text.TextAbsorber();
            Aspose.Pdf.XForm appearance = annot.Appearance["N"];
            absorber.Visit(appearance);
            Console.WriteLine(absorber.Text);
        }
    }
}