Zjistěte Formát souboru a zkontrolujte kompatibilitu formátu
Někdy je nutné před otevřením určit formát dokumentu, protože přípona souboru nezaručuje, že obsah souboru je vhodný. Například je známo, že Crystal Reports často vydává dokumenty ve formátu RTF, ale dává jim .rozšíření doc.
Aspose.Words poskytuje možnost získat informace o typu souboru, aby se zabránilo výjimce, pokud si nejste jisti, jaký je skutečný obsah souboru.
Detekce formátu souboru bez výjimky
Pokud máte co do činění s více dokumenty v různých formátech souborů, možná budete muset oddělit ty soubory, které lze zpracovat Aspose.Words, od těch, které nemohou. Možná budete chtít vědět, proč některé dokumenty nelze zpracovat.
Pokud se pokusíte načíst soubor do objektu Document a Aspose.Words nemůže rozpoznat formát souboru nebo formát není podporován, Aspose.Words vyvolá výjimku. Tyto výjimky můžete zachytit a analyzovat, ale Aspose.Words také poskytuje metodu DetectFileFormat, která nám umožňuje rychle určit formát souboru bez načtení dokumentu s možnými výjimkami. Tato metoda vrací objekt FileFormatInfo, který obsahuje zjištěné informace o typu souboru.
Zkontrolujte Kompatibilitu Formátu Souborů
Můžeme zkontrolovat kompatibilitu formátu všech souborů ve vybrané složce a třídit je podle formátu do odpovídajících podsložek.
Protože máme co do činění s obsahem ve složce, první věcí, kterou musíme udělat, je získat sbírku všech souborů v této složce pomocí metody GetFiles třídy Directory
(z oboru názvů System.IO
).
Následující příklad kódu ukazuje, jak získat seznam všech souborů ve složce:
Když jsou všechny soubory shromážděny, zbytek práce se provádí metodou DetectFileFormat, která kontroluje Formát souboru.
Následující příklad kódu ukazuje, jak iterovat shromážděný seznam souborů, zkontrolovat formát každého souboru a přesunout každý soubor do příslušné složky:
Soubory jsou přesunuty do příslušných podsložek pomocí metody Move
třídy File
ze stejného jmenného prostoru System.IO
.
Ve výše uvedeném příkladu jsou použity následující soubory. Název souboru je vlevo a jeho popis je vpravo:
Skupina souborů | Vstupní Dokument | Typus |
---|---|---|
Podporované formáty souborů | Test File (DOC).doc | Microsoft Word 95/6.0 nebo Microsoft Word 97 – dokument z roku 2003. |
Test File (DOT).dot | Microsoft Word 95/6.0 nebo Microsoft Word 97 – 2003 šablona. | |
Test File (DOCX).docx | Office otevřít XML WordprocessingML dokument bez Maker. | |
Test File (DOCM).docm | Office otevřít XML WordprocessingML dokument s makry. | |
Test File (DOTX).dotx | Office Open XML WordprocessingML šablona. | |
Test File (DOTM).dotm | Office otevřete šablonu XML WordprocessingML s makry. | |
Test File (XML).xml | FlatOPC OOXML dokument. | |
Test File (RTF).rtf | Formát RTF dokumentu. | |
Test File (WordML).xml | Microsoft Word 2003 WordprocessingML dokument. | |
Test File (HTML).html | HTML dokument. | |
Test File (MHTML).mhtml | MHTML (webový archiv) dokument. | |
Test File (ODT).odt | OpenDocument Text (OpenOffice Writer). | |
Test File (OTT).ott | OpenDocument Šablona Dokumentu. | |
Test File (DocPreWord60).doc | Microsoft Word 2.0 dokument. | |
Šifrované dokumenty | Test File (Enc).doc | Šifrovaný dokument Microsoft Word 95/6.0 nebo Microsoft Word 97 – 2003. |
Test File (Enc).docx | Zašifrovaná kancelář otevřít XML WordprocessingML dokument. | |
Nepodporované formáty souborů | Test File (JPG).jpg | JPEG soubor obrázku. |