Извлечение помеченного содержимого из PDF

В этой статье вы узнаете, как извлечь помеченное содержимое из PDF-документа с использованием C#.

Следующий фрагмент кода также работает с библиотекой Aspose.PDF.Drawing.

Получение содержимого помеченного PDF

Чтобы получить содержимое PDF-документа с помеченным текстом, Aspose.PDF предлагает свойство TaggedContent класса Document.

Следующий фрагмент кода показывает, как получить содержимое PDF-документа с помеченным текстом:

Получение корневой структуры

Чтобы получить корневую структуру помеченного PDF-документа, Aspose.PDF предлагает свойство StructTreeRootElement интерфейса ITaggedContent и StructureElement. Следующий фрагмент кода показывает, как получить корневую структуру помеченного PDF-документа:

Доступ к дочерним элементам

Чтобы получить доступ к дочерним элементам помеченного PDF-документа, Aspose.PDF предлагает класс ElementList. Следующий фрагмент кода показывает, как получить доступ к дочерним элементам помеченного PDF-документа:

Пометка изображений в существующем PDF

Чтобы пометить изображения в существующем PDF-документе, Aspose.PDF предлагает метод FindElements класса StructureElement. Вы можете добавить альтернативный текст для фигур, используя свойство AlternativeText класса FigureElement.

Следующий фрагмент кода показывает, как пометить изображения в существующем PDF-документе: