Анализ PDF-документов
Анализ PDF документов — это термин, связанный с извлечением различных видов информации из PDF-файла. В этом разделе рассказывается, как:
- Извлечь текст из PDF - aнализ текста или его извлечение — самая популярная операция с готовыми PDF-файлами. Вы узнаете об анализе текста из всего документа, отдельной страницы или определённой области на странице.
- Извлечь изображения из PDF - извлечение изображений аналогично операции, описанной выше для текста.
- Извлечь шрифты из PDF - извлечение шрифтов — это специфическая операция со шрифтами в PDF-файлах.
- Извлечь данные из формы - если у вас есть несколько PDF-документов с формами, возможно, вам потребуется извлечь данные из этих форм. Эта статья поможет понять, как извлекать данные AcroForms с помощью Aspose.PDF for .NET.
- Извлечь текст из штампов — получить текстовую информацию из вашего PDF-документа.
- Извлечь данные из таблицы — получить данные из таблицы в PDF-документе.
- Извлечь векторные данные из PDF — вы можете получить векторные данные (путь, многоугольник, полилинию), такие как положение, цвет, ширина линии и т. д.