PDFファイルからリンクを抽出する

PDFファイルからリンクを抽出する

リンクはPDFファイル内で注釈として表現されるため、リンクを抽出するには、すべてのLinkAnnotationオブジェクトを抽出します。

  1. Documentオブジェクトを作成します。
  2. リンクを抽出したいPageを取得します。
  3. Use the AnnotationSelector クラスを使用して、指定されたページからすべての LinkAnnotation オブジェクトを抽出します。
  4. AnnotationSelector オブジェクトを Page オブジェクトの Accept メソッドに渡します。
  5. AnnotationSelector オブジェクトの Selected プロパティを使用して、選択されたすべてのリンク注釈を IList オブジェクトに取得します。

次のコードスニペットは、PDFファイルからリンクを抽出する方法を示しています。

void ExtractLinksFromThePDFFile() {
   
    // PDFファイルを読み込む
    String _dataDir("C:\\Samples\\");

    // Documentインスタンスを作成
    auto document = MakeObject<Document>(_dataDir + u"UpdateLinks.pdf");

    // PDFファイルのページコレクションにページを追加
    auto page = document->get_Pages()->idx_get(1);


    auto selector = MakeObject<Aspose::Pdf::Annotations::AnnotationSelector>(MakeObject<Aspose::Pdf::Annotations::LinkAnnotation>(page, Rectangle::get_Trivial()));
    page->Accept(selector);
    auto list = selector->get_Selected();
    for (auto annot : list)
    {
        Console::WriteLine(u"Annotation located: {0}", annot->get_Rect());
    }
}