استخراج النص من جميع صفحات مستند PDF في PHP
Contents
[
Hide
]
Aspose.PDF - استخراج النص من جميع الصفحات
لاستخراج النص من جميع صفحات مستند PDF باستخدام Aspose.PDF Java for PHP، ببساطة قم باستدعاء وحدة ExtractTextFromAllPages. كود PHP
# افتح المستند المستهدف
$pdf = new Document($dataDir . 'input1.pdf');
# إنشاء كائن TextAbsorber لاستخراج النص
$text_absorber = new TextAbsorber();
# قبول المستخلص لجميع الصفحات
$pdf->getPages()->accept($text_absorber);
# لاستخراج النص من صفحة معينة من المستند، نحتاج إلى تحديد الصفحة المعينة باستخدام فهرسها ضد طريقة accept(..).
# قبول المستخلص لصفحة PDF معينة
# pdfDocument.getPages().get_Item(1).accept(textAbsorber);
# الحصول على النص المستخرج
$extracted_text = $text_absorber->getText();
# إنشاء كاتب وفتح الملف
$writer = new FileWriter(new File($dataDir . "extracted_text.out.txt"));
$writer->write($extracted_text);
# كتابة سطر من النص إلى الملف
# tw.WriteLine(extractedText);
# إغلاق التيار
$writer->close();
print "تم استخراج النص بنجاح. تحقق من ملف الإخراج." . PHP_EOL;
تنزيل الشيفرة الجاهزة للتشغيل
قم بتنزيل استخراج النص من جميع الصفحات (Aspose.PDF) من أي من مواقع البرمجة الاجتماعية المذكورة أدناه: