Разбор PDF документов
Contents
[
Hide
]
Разбор PDF документов - это термин, связанный с извлечением различной информации из PDF файла. Этот раздел охватывает, как:
- Извлечение текста из PDF. Разбор или извлечение текста — одна из самых популярных операций с готовыми PDF. Вы узнаете, как извлекать текст из всего документа, отдельной страницы или определённой области страницы.
- Извлечение изображений из PDF. Извлечение изображений выполняет для изображений ту же задачу, что и операция выше для текста.
- Извлечение шрифтов из PDF. Извлечение шрифтов — специализированная операция для работы со шрифтами в PDF.
- Извлечение данных из формы. Если у вас много PDF-документов с формами, вероятно, вам нужно получать данные из этих форм. Эта статья поможет понять, как извлекать данные AcroForms с помощью Aspose.PDF for Python via .NET.
- Извлечение данных из таблицы. Получение данных из таблицы в PDF-документе.
- Извлечение векторных данных из PDF. Вы можете извлекать векторные данные (path, polygon, polyline), такие как позиция, цвет, толщина линии и т. д.