Extrair Links do Arquivo PDF

Links são representados como anotações em um arquivo PDF, então para extrair links, extraia todos os objetos LinkAnnotation.

  1. Crie um objeto Document.

  2. Obtenha a Page da qual você deseja extrair links.

  3. Use a classe AnnotationSelector para extrair todos os objetos LinkAnnotation da página especificada.

  4. Passe o objeto AnnotationSelector para o método Accept do objeto Page.

  5. Obtenha todas as anotações de link selecionadas em um objeto IList usando o método getSelected do objeto AnnotationSelector.

O trecho de código a seguir mostra como extrair links de um arquivo PDF.

    public static void ExtractLinksFromThePDFFile() {        
        // Carregar o arquivo PDF
        Document document = new Document(_dataDir + "UpdateLinks.pdf");
        Page page = document.getPages().get_Item(1);
           
        AnnotationSelector selector = new AnnotationSelector(new LinkAnnotation(page, Rectangle.getTrivial()));
        page.accept(selector);
        java.util.List<Annotation> list = selector.getSelected();
        for(Annotation annot : list)
        {
            System.out.println("Anotação localizada: " + annot.getRect());
        }
                
        // Salvar o documento com link atualizado
        //document.save(_dataDir + "ExtractLinks_out.pdf");
    }