Извлечение ссылок из PDF файла

Извлечение ссылок из PDF файла

Ссылки представлены как аннотации в PDF файле, поэтому для извлечения ссылок извлеките все объекты LinkAnnotation.

  1. Создайте объект Document.
  2. Получите Page, с которой вы хотите извлечь ссылки.
  3. Используйте класс AnnotationSelector, чтобы извлечь все объекты LinkAnnotation с указанной страницы.
  4. Передайте объект AnnotationSelector методу Accept объекта Page.
  5. Получите все выбранные аннотации ссылок в объект IList, используя свойство Selected объекта AnnotationSelector.

Следующий фрагмент кода показывает, как извлечь ссылки из PDF файла.

void ExtractLinksFromThePDFFile() {
   
    // Загрузите PDF файл
    String _dataDir("C:\\Samples\\");

    // Создайте экземпляр документа
    auto document = MakeObject<Document>(_dataDir + u"UpdateLinks.pdf");

    // Добавьте страницу в коллекцию страниц PDF файла
    auto page = document->get_Pages()->idx_get(1);


    auto selector = MakeObject<Aspose::Pdf::Annotations::AnnotationSelector>(MakeObject<Aspose::Pdf::Annotations::LinkAnnotation>(page, Rectangle::get_Trivial()));
    page->Accept(selector);
    auto list = selector->get_Selected();
    for (auto annot : list)
    {
        Console::WriteLine(u"Аннотация расположена: {0}", annot->get_Rect());
    }
}