Извлечение Текста из Штампов

Извлечение Текста из Аннотаций Штампов

Aspose.PDF для PHP через Java позволяет извлекать текст из аннотаций штампов. Для извлечения текста из аннотаций штампов в PDF можно использовать следующие шаги.

  1. Загрузите PDF документ
  2. Получите нужную страницу документа
  3. Создайте новый экземпляр класса StampAnnotation
  4. Создайте новый экземпляр класса AnnotationSelector и передайте ему аннотацию штампа
  5. Примените селектор аннотаций на странице
  6. Получите выбранные аннотации штампов
  7. Создайте новый экземпляр класса TextAbsorber
  8. Получите первую аннотацию штампа
  9. Получите нормальное отображение аннотации штампа
  10. Посетите отображение с использованием поглотителя текста
  11. Получите извлеченный текст из поглотителя текста
  12. Закройте документ
    $responseData = "";
    $document = new Document($inputFile);
    $page = $document->getPages()->get_Item(1);
    $stampAnnotation = new StampAnnotation($document);
    $annotationSelector = new AnnotationSelector($stampAnnotation);
    $page->accept($annotationSelector);
    $stampAnnotations = $annotationSelector->getSelected();
    $textAbsorber = new TextAbsorber();
    $stampAnnotation = $stampAnnotations->get(0);    
    $appearance = $stampAnnotation->getNormalAppearance();
    $textAbsorber->visit($appearance);
    $responseData = java_values($textAbsorber->getText());       
    $document->close();