PDF에서 텍스트 추출 - Facades

문서의 모든 페이지에서 텍스트 추출

PDF 문서의 모든 페이지에서 텍스트를 추출하기 위해, **Aspose.PDF for C++**는 Facades 네임스페이스 아래에 PdfExtractor 클래스를 제공합니다. PDF 문서에서 모든 텍스트를 추출하여 MemoryStream 객체에 저장하고, 추가 조작을 위해 문자열로 가져올 수 있습니다. 다음 코드 스니펫은 PDF 문서의 모든 페이지에서 텍스트를 추출하기 위해 PdfExtractor 클래스를 사용하는 방법을 보여줍니다.

For complete examples and data files, please go to https://github.com/aspose-pdf/Aspose.Pdf-for-C
auto extractor = MakeObject<Facades::PdfExtractor>();
extractor->BindPdf(L"..\\Data\\Text\\input.pdf");
extractor->ExtractText();
auto memStream = MakeObject<IO::MemoryStream>();
extractor->GetText(memStream);
auto unicode = System::Text::Encoding::get_Unicode();
String allText = unicode->GetString(memStream->ToArray());
Console::WriteLine(allText);