Анализ PDF-документов

Contents
[ ]

Анализ PDF документов — это термин, связанный с извлечением различных видов информации из PDF-файла. В этом разделе рассказывается, как:

  • Извлечь текст из PDF. Анализ текста или его извлечение — самая популярная операция с готовыми PDF-файлами. Вы узнаете об анализе текста из всего документа, отдельной страницы или определённой области на странице.
  • Извлечь изображения из PDF. Извлечение изображений аналогично операции, описанной выше для текста.
  • Извлечь шрифты из PDF. Извлечение шрифтов — это специфическая операция со шрифтами в PDF-файлах.
  • Извлечь данные из формы. Если у вас есть несколько PDF-документов с формами, возможно, вам потребуется извлечь данные из этих форм. Эта статья поможет понять, как извлекать данные AcroForms с помощью Aspose.PDF for .NET.
  • Извлечь текст из штампов — получить текстовую информацию из вашего PDF-документа.
  • Извлечь данные из таблицы — получить данные из таблицы в PDF-документе.
  • Извлечь векторные данные из PDF — вы можете получить векторные данные (путь, многоугольник, полилинию), такие как положение, цвет, ширина линии и т. д.