Парсинг PDF документов
Contents
[
Hide
]
Парсинг PDF документов — это термин, связанный с извлечением различных видов информации из PDF файла. Этот раздел охватывает как:
- Извлечь текст из PDF. Парсинг или извлечение текста — это самая популярная операция с готовыми PDF. Вы узнаете о парсинге текста из всего документа, отдельной страницы или определенного региона на странице.
- Извлечь изображения из PDF. Извлечение изображений выполняет ту же функцию для изображений, что и операция выше для текста.
- Извлечь шрифты из PDF. Извлечение шрифтов — это специфическая операция со шрифтами в PDF.
- Извлечь данные из таблицы в PDF. Learn how to extract tabular from PDF using Aspose.PDF for PHP.
- Извлечение данных из формы. Если у вас есть множество PDF-документов с формами, вероятно, вам нужно получить данные из этих форм. Эта статья поможет понять, как извлечь данные AcroForms с помощью Aspose.PDF для PHP.