Разбор PDF документов

Contents
[ ]

Разбор PDF документов - это термин, связанный с извлечением различной информации из PDF файла. Этот раздел охватывает, как:

  • Извлечение текста из PDF. Разбор или извлечение текста — одна из самых популярных операций с готовыми PDF. Вы узнаете, как извлекать текст из всего документа, отдельной страницы или определённой области страницы.
  • Извлечение изображений из PDF. Извлечение изображений выполняет для изображений ту же задачу, что и операция выше для текста.
  • Извлечение шрифтов из PDF. Извлечение шрифтов — специализированная операция для работы со шрифтами в PDF.
  • Извлечение данных из формы. Если у вас много PDF-документов с формами, вероятно, вам нужно получать данные из этих форм. Эта статья поможет понять, как извлекать данные AcroForms с помощью Aspose.PDF for Python via .NET.
  • Извлечение данных из таблицы. Получение данных из таблицы в PDF-документе.
  • Извлечение векторных данных из PDF. Вы можете извлекать векторные данные (path, polygon, polyline), такие как позиция, цвет, толщина линии и т. д.