Извлечение текста из штампов с помощью C#

Извлечение текста из аннотаций штампов

Aspose.PDF для NET позволяет извлекать текст из аннотаций штампов. Для извлечения текста из аннотаций штампов в PDF можно выполнить следующие действия.

  1. Создайте объект класса Document.
  2. Получите нужную Annotation из списка аннотаций страницы.
  3. Определите новый объект класса TextAbsorber.
  4. Используйте метод TextAbsorber visit, чтобы получить текст.

Следующий фрагмент кода также работает с библиотекой Aspose.PDF.Drawing.

// For complete examples and data files, visit https://github.com/aspose-pdf/Aspose.PDF-for-.NET
private static void ExtractText()
{
    // The path to the documents directory
    var dataDir = RunExamples.GetDataDir_AsposePdf_Text();

    // Open PDF document
    using (var document = new Aspose.Pdf.Document(dataDir + "ExtractStampText.pdf"))
    {
        Aspose.Pdf.Annotations.Annotation item = document.Pages[1].Annotations[1];
        if (item is Aspose.Pdf.Annotations.StampAnnotation annot)
        {
            var absorber = new Aspose.Pdf.Text.TextAbsorber();
            Aspose.Pdf.XForm appearance = annot.Appearance["N"];
            absorber.Visit(appearance);
            Console.WriteLine(absorber.Text);
        }
    }
}