Extrair Páginas PDF em Python

Extrair Página Única de um PDF

Extrair uma página específica de um documento PDF e salvá‑la como um novo arquivo. Usando a biblioteca Aspose.PDF, o script copia a página desejada para um novo PDF, deixando o documento original inalterado. Isso é útil para dividir PDFs ou isolar páginas importantes para distribuição.

  1. Carregue o PDF de origem usando o Document API (ap.Document()).
  2. Crie um novo Document para armazenar a página extraída.
  3. Adicionar o desejado Page do documento fonte para o novo PDF usando o documento de destino PageCollection (dst_document.pages.add(...)).
    • Neste exemplo, a página 2 é extraída (indexação baseada em 1).
  4. Salvar o novo Document com a página extraída para o arquivo de saída especificado.
import aspose.pdf as ap

def extract_page(input_file_name: str, output_file_name: str) -> None:
    src_document = ap.Document(input_file_name)
    dst_document = ap.Document()
    dst_document.pages.add(src_document.pages[2])
    dst_document.save(output_file_name)

Extrair Múltiplas Páginas de um PDF

Extrair várias páginas específicas de um documento PDF e salvá‑las em um novo arquivo. Usando a biblioteca Aspose.PDF, as páginas selecionadas são copiadas para um novo PDF enquanto o documento original permanece intacto. Isso é útil para criar PDFs menores contendo apenas as seções relevantes de um documento maior.

  1. Carregue o PDF de origem usando o Document API (ap.Document()).
  2. Crie um novo Document para armazenar as páginas extraídas.
  3. Selecione as páginas a extrair (neste exemplo, páginas 2 e 3 usando indexação baseada em 1).
  4. Adicione cada selecionado Page do documento fonte para o novo PDF usando seu PageCollection.
  5. Salvar o novo Document com as páginas extraídas para o arquivo de saída especificado.
import aspose.pdf as ap

def extract_multiple_pages(input_file_name: str, output_file_name: str) -> None:
    document = ap.Document(input_file_name)
    pages = [2, 3]
    another_document = ap.Document()
    for page_index in pages:
        another_document.pages.add(document.pages[page_index])
    another_document.save(output_file_name)

Tópicos de Página Relacionados