Konversi PDF ke Microsoft Word
Ikhtisar
Artikel ini menjelaskan cara mengonversi PDF ke Word menggunakan PHP. Kodenya sangat sederhana, cukup muat PDF ke kelas Document dan simpan sebagai output format Microsoft Word DOC atau DOCX. Ini mencakup topik-topik berikut
Konversi PDF ke DOC
Salah satu fitur yang paling populer adalah konversi PDF ke Microsoft Word DOC, yang membuat konten mudah untuk dimanipulasi. Aspose.PDF untuk PHP memungkinkan Anda untuk mengonversi file PDF ke DOC.
Aspose.PDF untuk PHP dapat membuat dokumen PDF dari awal dan merupakan toolkit yang hebat untuk memperbarui, mengedit, dan memanipulasi dokumen PDF yang sudah ada. Fitur penting lainnya adalah kemampuan untuk mengonversi halaman dan seluruh dokumen PDF menjadi gambar. Fitur populer lainnya adalah konversi PDF ke Microsoft Word DOC, yang membuat konten mudah untuk dimanipulasi. (Sebagian besar pengguna tidak dapat mengedit dokumen PDF tetapi dapat dengan mudah bekerja dengan tabel, teks, dan gambar di Microsoft Word.)
Untuk membuatnya sederhana dan mudah dipahami, Aspose.PDF untuk PHP menyediakan kode dua baris untuk mengubah file PDF sumber menjadi file DOC.
Cuplikan kode Java berikut menunjukkan proses mengonversi file PDF menjadi format DOC.
-
Buat instance objek Document dengan dokumen PDF sumber.
-
Simpan ke format SaveFormat.Doc dengan memanggil metode Document.save().
// Muat dokumen PDF
$document = new Document($inputFile);
// Buat objek DocSaveOptions baru
$saveOption = new DocSaveOptions();
// Atur format output ke DOC
$saveOption->setFormat(DocSaveOptions_DocFormat::$Doc);
// Simpan dokumen sebagai DOC
$document->save($outputFile, $saveOption);
Menggunakan Kelas DocSaveOptions
Kelas DocSaveOptions menyediakan banyak properti yang meningkatkan proses konversi file PDF ke format DOC. Di antara properti-properti ini, Mode memungkinkan Anda untuk menentukan mode pengenalan untuk konten PDF. Anda dapat menentukan nilai apa pun dari enumerasi RecognitionMode untuk properti ini. Setiap nilai ini memiliki manfaat dan keterbatasan khusus:
-
Mode Textbox cepat dan baik untuk mempertahankan tampilan asli file PDF, tetapi kemampuan untuk mengedit dokumen yang dihasilkan bisa terbatas. Setiap blok teks yang dikelompokkan secara visual dalam PDF asli diubah menjadi kotak teks dalam dokumen keluaran. Ini mencapai kemiripan maksimal dengan aslinya sehingga dokumen keluaran terlihat bagus, tetapi sepenuhnya terdiri dari kotak teks dan ini dapat membuat pengeditan di Microsoft Word menjadi sulit.
-
Flow adalah mode pengenalan penuh, di mana mesin melakukan pengelompokan dan analisis multi-level untuk mengembalikan dokumen asli sesuai dengan maksud penulis sambil menghasilkan dokumen yang mudah diedit. Keterbatasannya adalah dokumen keluaran mungkin terlihat berbeda dari aslinya.
-
Properti RelativeHorizontalProximity dapat digunakan untuk mengontrol kedekatan relatif antara elemen teks dan berarti bahwa jarak dinormalkan oleh ukuran font. Font yang lebih besar mungkin memiliki jarak lebih besar antara suku kata dan masih dianggap sebagai satu kesatuan. Ini ditentukan sebagai persentase dari ukuran font, misalnya, 1 = 100%. Ini berarti bahwa dua karakter 12pt yang ditempatkan 12 pt terpisah dianggap berdekatan.
-
RecognitionBullets digunakan untuk mengaktifkan pengenalan bullet selama konversi.
// Muat dokumen PDF
$document = new Document($inputFile);
// Buat objek DocSaveOptions baru
$saveOption = new DocSaveOptions();
// Atur mode pengenalan ke EnhancedFlow
$saveOption->setMode(DocSaveOptions_RecognitionMode::$EnhancedFlow);
// Atur format keluaran ke DOC
$saveOption->setFormat(DocSaveOptions_DocFormat::$Doc);
// Atur mode pengenalan sebagai Flow
saveOptions->setMode(DocSaveOptions_RecognitionMode::$Flow);
// Atur kedekatan horizontal sebagai 2.5
saveOptions->setRelativeHorizontalProximity(2.5f);
// Aktifkan nilai untuk mengenali bullet selama proses konversi
saveOptions->setRecognizeBullets(true);
// Simpan dokumen sebagai DOCX
$document->save($outputFile, $saveOption);
Coba konversi PDF ke DOC secara online
Aspose.PDF untuk PHP menghadirkan aplikasi online gratis “PDF to Word”, di mana Anda dapat mencoba menyelidiki fungsionalitas dan kualitas kerjanya.
Mengonversi PDF ke DOCX
Enumerasi DocFormat juga menyediakan opsi untuk memilih DOCX sebagai format keluaran untuk dokumen Word. Untuk merender file PDF sumber ke format DOCX, gunakan potongan kode yang ditentukan di bawah ini.
Cara mengonversi PDF ke DOCX
Potongan kode Java berikut menunjukkan proses mengonversi file PDF ke format DOCX.
- Buat instance objek Document dengan dokumen PDF sumber.
- Simpan ke format SaveFormat.DocX dengan memanggil metode Document.save().
// Memuat dokumen PDF
$document = new Document($inputFile);
// Menyimpan dokumen sebagai DOCX
$document->save($outputFile, SaveFormat::$DocX);
Kelas DocSaveOptions memiliki properti bernama Format yang menyediakan kemampuan untuk menentukan format dokumen hasil, yaitu, DOC atau DOCX. Untuk mengonversi file PDF ke format DOCX, silakan berikan nilai Docx dari enumerasi DocSaveOptions.DocFormat.
Silakan lihat cuplikan kode berikut yang menyediakan kemampuan untuk mengonversi file PDF ke format DOCX dengan Java.
// Muat dokumen PDF
$document = new Document($inputFile);
// Buat objek DocSaveOptions baru
$saveOption = new DocSaveOptions();
// Atur mode pengenalan ke EnhancedFlow
$saveOption->setMode(DocSaveOptions_RecognitionMode::$EnhancedFlow);
// Atur format keluaran ke DOCX
$saveOption->setFormat(DocSaveOptions_DocFormat::$DocX);
// Simpan dokumen sebagai DOCX
$document->save($outputFile, $saveOption);
Coba konversi PDF ke DOCX secara online
Aspose.PDF untuk PHP menyajikan aplikasi gratis online “PDF ke DOCX”, di mana Anda dapat mencoba menyelidiki fungsionalitas dan kualitasnya bekerja.