Substituir Texto com Regex

Contents
[ ]

Expressões regulares permitem substituição flexível de texto baseada em padrões em vez de cadeias fixas. Ao habilitar o suporte a regex em ‘replace_text_strategy’, você pode corresponder conteúdo dinâmico, como números, datas ou strings formatadas.

  1. Criar um PdfContentEditor instância.
  2. Vincule o documento PDF de entrada.
  3. Configure a estratégia de substituição para usar regex.
  4. Substitua padrões correspondentes em todo o documento.
  5. Salve o documento PDF atualizado.
import aspose.pdf as ap
import aspose.pdf.facades as pdf_facades
import sys
from os import path

sys.path.append(path.join(path.dirname(__file__), ".."))

from config import set_license, initialize_data_dir


def replace_text_regex(infile, outfile):
    # Create PdfContentEditor object
    content_editor = pdf_facades.PdfContentEditor()
    # Bind document to PdfContentEditor
    content_editor.bind_pdf(infile)
    # Replace text in the whole document
    content_editor.replace_text_strategy.replace_scope = (
        pdf_facades.ReplaceTextStrategy.Scope.REPLACE_ALL
    )
    content_editor.replace_text_strategy.is_regular_expression_used = True
    content_editor.replace_text(r"\d{4}", "[NUMBER]")
    # Save updated document
    content_editor.save(outfile)