Détecter le Format de Fichier et vérifier la compatibilité des Formats

Parfois, il est nécessaire de déterminer le format d’un document avant de l’ouvrir car l’extension de fichier ne garantit pas que le contenu du fichier est approprié. Par exemple, il est connu que Crystal Reports génère souvent des documents au format RTF, mais leur donne le .extension de document.

Aspose.Words permet d’obtenir des informations sur le type de fichier afin d’éviter une exception si vous n’êtes pas sûr du contenu réel du fichier.

Détecter le format de fichier sans exception

Lorsque vous traitez plusieurs documents dans différents formats de fichiers, vous devrez peut-être séparer les fichiers qui peuvent être traités par Aspose.Words de ceux qui ne le peuvent pas. Vous voudrez peut-être aussi savoir pourquoi certains documents ne peuvent pas être traités.

Si vous essayez de charger un fichier dans un objet Document et que Aspose.Words ne peut pas reconnaître le format de fichier ou que le format n’est pas pris en charge, Aspose.Words lèvera une exception. Vous pouvez intercepter ces exceptions et les analyser, mais Aspose.Words fournit également la méthode DetectFileFormat qui nous permet de déterminer rapidement le format de fichier sans charger un document avec d’éventuelles exceptions. Cette méthode renvoie un objet FileFormatInfo qui contient les informations détectées sur le type de fichier.

Vérifier La Compatibilité Des Formats De Fichiers

Nous pouvons vérifier la compatibilité des formats de tous les fichiers du dossier sélectionné et les trier par format dans les sous-dossiers correspondants.

Puisque nous traitons du contenu d’un dossier, la première chose à faire est d’obtenir une collection de tous les fichiers de ce dossier en utilisant la méthode GetFiles de la classe Directory (à partir de l’espace de noms System.IO).

L’exemple de code suivant montre comment obtenir une liste de tous les fichiers du dossier:

Lorsque tous les fichiers sont collectés, le reste du travail est effectué par la méthode DetectFileFormat, qui vérifie le format du fichier.

L’exemple de code suivant montre comment parcourir la liste de fichiers collectés, vérifier le format de chaque fichier et déplacer chaque fichier vers le dossier approprié:

Les fichiers sont déplacés dans les sous-dossiers appropriés en utilisant la méthode Move de la classe File, à partir du même espace de noms System.IO.

Les fichiers suivants sont utilisés dans l’exemple ci-dessus. Le nom du fichier est à gauche et sa description est à droite:

Groupe de Fichiers Document d’entrée Type
Formats de fichiers pris en charge Test File (Doc).doc Microsoft Word 95 / 6.0 ou Microsoft Word 97-document de 2003.
Test File (Dot).dot Microsoft Word 95/6.0 ou Microsoft Word 97 – modèle de 2003.
Test File (Docx).docx Office Ouvre XML WordprocessingML document sans macros.
Test File (Docm).docm Office Ouvre un document XML WordprocessingML avec des macros.
Test File (Dotx).dotx Modèle Office Ouvert XML WordprocessingML.
Test File (Dotm).dotm Modèle Office Open XML WordprocessingML avec macros.
Test File (XML).xml FlatOPC OOXML Document.
Test File (RTF).rtf Document au Format Texte Enrichi.
Test File (WordML).xml Microsoft Word 2003 WordprocessingML document.
Test File (HTML).html HTML document.
Test File (MHTML).mhtml MHTML (archive Web) document.
Test File (Odt).odt OpenDocument Texte (OpenOffice Écrivain).
Test File (Ott).ott OpenDocument Modèle de document.
Test File (DocPreWord60).doc Microsoft Word 2.0 document.
Documents chiffrés Test File (Enc).doc Crypté Microsoft Word 95/6.0 ou Microsoft Word 97 – document de 2003.
Test File (Enc).docx Bureau crypté Ouvert XML WordprocessingML document.
Formats de fichiers non pris en charge Test File (JPG).jpg JPEG fichier image.