Extraire le texte des tampons
Contents
[
Hide
]
Extraire le texte des annotations de tampon
Aspose.PDF pour PHP via Java vous permet d’extraire le texte des annotations de tampon. Afin d’extraire le texte des annotations de tampon dans un PDF, les étapes suivantes peuvent être utilisées.
- Charger le document PDF
- Obtenir la page souhaitée du document
- Créer une nouvelle instance de la classe StampAnnotation
- Créer une nouvelle instance de la classe AnnotationSelector et lui passer l’annotation de tampon
- Accepter le sélecteur d’annotations sur la page
- Obtenir les annotations de tampon sélectionnées
- Créer une nouvelle instance de la classe TextAbsorber
- Obtenir la première annotation de tampon
- Obtenir l’apparence normale de l’annotation de tampon
- Visiter l’apparence en utilisant le text absorber
- Obtenir le texte extrait du text absorber
- Fermer le document
$responseData = "";
$document = new Document($inputFile);
$page = $document->getPages()->get_Item(1);
$stampAnnotation = new StampAnnotation($document);
$annotationSelector = new AnnotationSelector($stampAnnotation);
$page->accept($annotationSelector);
$stampAnnotations = $annotationSelector->getSelected();
$textAbsorber = new TextAbsorber();
$stampAnnotation = $stampAnnotations->get(0);
$appearance = $stampAnnotation->getNormalAppearance();
$textAbsorber->visit($appearance);
$responseData = java_values($textAbsorber->getText());
$document->close();