Extrair fontes de PDF via Python

Contents
[ ]

Usar Document para abrir o PDF e chamar font_utilities.get_all_fonts() para recuperar tudo disponível Font objetos referenciados pelo documento. Isso é útil ao auditar fontes incorporadas, verificar a disponibilidade de fontes antes da conversão ou analisar os recursos do documento.

  1. Abra o PDF de origem como um Document.
  2. Chamar document.font_utilities.get_all_fonts() para obter a coleção de fontes.
  3. Iterar sobre o retornado Font objetos.
  4. Leia e imprima cada font.font_name valor.

    import aspose.pdf as apdf
    from os import path

    path_infile = path.join(self.dataDir, infile)

    # Open PDF document
    document = apdf.Document(path_infile)

    fonts = document.font_utilities.get_all_fonts()
    for font in fonts:
        print(font.font_name)