Convertir un fichier PDF en d'autres formats

Convertir PDF en EPUB

EPUB (abréviation de publication électronique) est une norme de livre électronique libre et ouverte de l’International Digital Publishing Forum (IDPF). Les fichiers ont l’extension .epub. EPUB est conçu pour un contenu reformatable, ce qui signifie qu’un lecteur EPUB peut optimiser le texte pour un appareil d’affichage particulier. EPUB prend également en charge le contenu à mise en page fixe. Le format est conçu comme un format unique que les éditeurs et les maisons de conversion peuvent utiliser en interne, ainsi que pour la distribution et la vente. Il remplace la norme Open eBook.

Aspose.PDF pour PHP prend en charge la fonctionnalité de conversion de documents PDF en format EPUB. Aspose.PDF pour PHP a une classe nommée EpubSaveOptions qui peut être utilisée comme second argument de la méthode Document.save(..) pour générer un fichier EPUB. Veuillez essayer d’utiliser l’extrait de code suivant pour répondre à cette exigence.

// Créer une nouvelle instance de la classe Document et charger le fichier PDF d'entrée
$document = new Document($inputFile);

// Créer une nouvelle instance de la classe EpubSaveOptions
$saveOption = new EpubSaveOptions();

// Enregistrer le document au format EPUB en utilisant les options de sauvegarde spécifiées
$document->save($outputFile, $saveOption);

Convertir PDF en LaTeX/TeX

Aspose.PDF pour PHP prend en charge la conversion de PDF en LaTeX/TeX. Le format de fichier LaTeX est un format de fichier texte avec un balisage spécial utilisé dans le système de préparation de documents basé sur TeX pour une composition de haute qualité.

Pour convertir des fichiers PDF en TeX, Aspose.PDF dispose de la classe LaTeXSaveOptions qui fournit la méthode setOutDirectoryPath pour enregistrer les images temporaires pendant le processus de conversion.

Le code suivant montre le processus de conversion de fichiers PDF au format TEX avec Java.

// Créer un nouvel objet Document et charger le fichier PDF d'entrée
$document = new Document($inputFile);

// Créer un nouvel objet LaTeXSaveOptions
$saveOption = new LaTeXSaveOptions();
$saveOption->setOutDirectoryPath ($pathToOutputDirectory)

// Enregistrer le document au format LaTeX
$document->save($outputFile, $saveOption);

Convertir PDF en Texte

Aspose.PDF pour PHP prend en charge la conversion de l’ensemble du document PDF et d’une seule page en un fichier texte.

Convertir l’ensemble du document PDF en fichier texte

Vous pouvez convertir un document PDF en fichier TXT en utilisant la méthode Visit de la classe TextAbsorber.

Le code suivant explique comment extraire les textes de toutes les pages.

// Charger le document PDF
$document = new Document($inputFile);

// Créer un objet TextAbsorber pour extraire le texte du document
$textAbsorber = new TextAbsorber();

// Extraire le texte du document
$textAbsorber->visit($document);
$content = $textAbsorber->getText();

// Enregistrer le texte extrait dans le fichier de sortie
file_put_contents($outputFile, $content);

// Obtenir la taille du fichier de sortie
$fileSize = filesize($outputFile);

Convertir une page PDF en fichier texte

Vous pouvez convertir un document PDF en fichier TXT avec Aspose.PDF pour PHP. Vous devez utiliser la méthode Visit de la classe TextAbsorber pour résoudre cette tâche.

Le fragment de code suivant explique comment extraire les textes des pages particulières.

// Charger le document PDF
$document = new Document($inputFile);

// Créer un objet TextAbsorber pour extraire le texte du document
$textAbsorber = new TextAbsorber();

$array = array(1, 3, 4);

foreach ($array as $page) {
    $textAbsorber->visit($document->getPages()->get_Item($page));
    $content = $textAbsorber->getText();
    
    $outputFile = $dataDir . DIRECTORY_SEPARATOR . 'result-pdf-to-text'. $page . '.txt';
    // Enregistrer le texte extrait dans le fichier de sortie
    file_put_contents($outputFile, $content);
}

Convertir PDF en XPS

Aspose.PDF pour PHP offre la possibilité de convertir des fichiers PDF au format XPS. Essayons d’utiliser l’extrait de code présenté pour convertir des fichiers PDF au format XPS avec Java.

Le type de fichier XPS est principalement associé au XML Paper Specification de Microsoft Corporation. Le XML Paper Specification (XPS), anciennement connu sous le nom de code Metro et intégrant le concept marketing Next Generation Print Path (NGPP), est l’initiative de Microsoft pour intégrer la création et la visualisation de documents dans le système d’exploitation Windows.

Pour convertir des fichiers PDF en XPS, Aspose.PDF dispose de la classe XpsSaveOptions qui est utilisée comme deuxième argument du constructeur Document.save(..) pour générer le fichier XPS. Le code ci-dessous montre le processus de conversion de fichiers PDF en format XPS.

// Créez un nouvel objet Document et chargez le fichier PDF d'entrée
$document = new Document($inputFile);

// Créez un nouvel objet XpsSaveOptions
$saveOption = new XpsSaveOptions();

// Enregistrez le document en tant que XPS en utilisant les options de sauvegarde spécifiées
$document->save($outputFile, $saveOption);