В этой статье вы узнаете, как извлечь помеченное содержимое из PDF-документа с использованием C#.
Следующий фрагмент кода также работает с библиотекой Aspose.PDF.Drawing.
Получение содержимого помеченного PDF
Чтобы получить содержимое PDF-документа с помеченным текстом, Aspose.PDF предлагает свойство TaggedContent класса Document.
Следующий фрагмент кода показывает, как получить содержимое PDF-документа с помеченным текстом:
Получение корневой структуры
Чтобы получить корневую структуру помеченного PDF-документа, Aspose.PDF предлагает свойство StructTreeRootElement интерфейса ITaggedContent и StructureElement. Следующий фрагмент кода показывает, как получить корневую структуру помеченного PDF-документа:
Доступ к дочерним элементам
Чтобы получить доступ к дочерним элементам помеченного PDF-документа, Aspose.PDF предлагает класс ElementList. Следующий фрагмент кода показывает, как получить доступ к дочерним элементам помеченного PDF-документа:
Пометка изображений в существующем PDF
Чтобы пометить изображения в существующем PDF-документе, Aspose.PDF предлагает метод FindElements класса StructureElement. Вы можете добавить альтернативный текст для фигур, используя свойство AlternativeText класса FigureElement.
Следующий фрагмент кода показывает, как пометить изображения в существующем PDF-документе: