Разбор PDF‑документов

Contents
[ ]

Разбор PDF‑документов — это термин, связанный с извлечением различных видов информации из PDF‑файла. В этом разделе рассматривается, как:

  • Извлечь текст из PDF. Парсинг текста или извлечение — самая популярная операция с готовыми PDF. Вы узнаете о парсинге текста из всего документа, отдельной страницы или определённого региона на странице.
  • Извлечь изображения из PDF. Извлечение изображений делает то же самое для изображений, что и операция выше для текста.
  • Извлечение данных из таблицы в PDF. Узнайте, как извлекать табличные данные из PDF с помощью Aspose.PDF for Android via Java.
  • Извлечение данных из формы. Если у вас есть множество PDF‑документов с формами, вероятно, вам нужно получить данные из этих форм. Эта статья поможет понять, как извлекать данные AcroForms с помощью Aspose.PDF for Android via Java.