Ekstrak Teks Dari Semua Halaman Dokumen PDF di PHP

Aspose.PDF - Ekstrak Teks Dari Semua Halaman

Untuk mengekstrak teks dari semua halaman dokumen PDF menggunakan Aspose.PDF Java untuk PHP, cukup panggil modul ExtractTextFromAllPages. Kode PHP


# Buka dokumen target
$pdf = new Document($dataDir . 'input1.pdf');

# buat objek TextAbsorber untuk mengekstrak teks
$text_absorber = new TextAbsorber();

# terima absorber untuk semua halaman
$pdf->getPages()->accept($text_absorber);

# Untuk mengekstrak teks dari halaman tertentu dokumen, kita perlu menentukan halaman tertentu menggunakan indeksnya terhadap metode accept(..).
# terima absorber untuk halaman PDF tertentu
# pdfDocument.getPages().get_Item(1).accept(textAbsorber);

# dapatkan teks yang diekstraksi
$extracted_text = $text_absorber->getText();

# buat penulis dan buka file
$writer = new FileWriter(new File($dataDir . "extracted_text.out.txt"));
$writer->write($extracted_text);
# tulis satu baris teks ke file
# tw.WriteLine(extractedText);
# tutup stream
$writer->close();

print "Teks berhasil diekstraksi. Periksa file keluaran." . PHP_EOL;

Unduh Kode yang Berjalan

Unduh Ekstrak Teks Dari Semua Halaman (Aspose.PDF) dari salah satu situs sosial pengkodean yang disebutkan di bawah ini: