استخراج النص من جميع صفحات مستند PDF في PHP

Aspose.PDF - استخراج النص من جميع الصفحات

لاستخراج النص من جميع صفحات مستند PDF باستخدام Aspose.PDF Java for PHP، ببساطة قم باستدعاء وحدة ExtractTextFromAllPages. كود PHP


# افتح المستند المستهدف
$pdf = new Document($dataDir . 'input1.pdf');

# إنشاء كائن TextAbsorber لاستخراج النص
$text_absorber = new TextAbsorber();

# قبول المستخلص لجميع الصفحات
$pdf->getPages()->accept($text_absorber);

# لاستخراج النص من صفحة معينة من المستند، نحتاج إلى تحديد الصفحة المعينة باستخدام فهرسها ضد طريقة accept(..).
# قبول المستخلص لصفحة PDF معينة
# pdfDocument.getPages().get_Item(1).accept(textAbsorber);

# الحصول على النص المستخرج
$extracted_text = $text_absorber->getText();

# إنشاء كاتب وفتح الملف
$writer = new FileWriter(new File($dataDir . "extracted_text.out.txt"));
$writer->write($extracted_text);
# كتابة سطر من النص إلى الملف
# tw.WriteLine(extractedText);
# إغلاق التيار
$writer->close();

print "تم استخراج النص بنجاح. تحقق من ملف الإخراج." . PHP_EOL;

تنزيل الشيفرة الجاهزة للتشغيل

قم بتنزيل استخراج النص من جميع الصفحات (Aspose.PDF) من أي من مواقع البرمجة الاجتماعية المذكورة أدناه: