Видалити формат файлів і перевірити формат сумісності
Іноді необхідно визначити формат документа перед відкриттям, оскільки розширення файлу не гарантує, що вміст файлу доречно. Наприклад, відомо, що кристалічні звіти часто виводяться документи у форматі RTF, але дають їм розширення .doc.
Aspose.Words дає можливість отримати інформацію про тип файлу, щоб уникнути виключення, якщо ви не впевнені, що фактичний зміст файлу є.
Видалити формат файлів без виключення
Коли ви працюєте з декількома документами в різних форматах файлів, вам може знадобитися відокремити ці файли, які можуть бути оброблені Aspose.Words від тих, хто не може. Ви також можете дізнатися, чому деякі документи не можуть бути оброблені.
Якщо ви спробуєте завантажити файл в файл Document об’єкт і Aspose.Words не може розпізнати формат файлу або формат не підтримується, Aspose.Words викине виняток. Ви можете зловити ті винятки і проаналізувати їх, але Aspose.Words також надає detect_file_format метод, який дозволяє нам швидко визначити формат файлів без завантаження документа з можливими винятками. Цей метод повертає FileFormatInfo об’єкт, який містить інформацію про тип файлу.
Перевірити формат файлів сумісність
Ми можемо перевірити формат сумісності всіх файлів у вибраній папці та сортувати їх за форматом у відповідні підпапки.
З тих пір, як ми працюємо з вмістом в папці, перше, що нам потрібно зробити, це зібрати всі файли в цій папці за допомогою папки Список метод методу з модуль.
Приклад наступного коду показує, як отримати список всіх файлів в папці:
Коли зібрані всі файли, решта роботи виконується detect_file_format метод, який перевіряє формат файлу.
Наприклад, наступний код показує, як ітерувати над зібраним переліком файлів, перевірити формат кожного файлу та переміщати кожен файл у відповідну папку:
Файли переміщуються в відповідні підпапки з використанням Файли метод методу Зареєструватися модуль.
На прикладі вище використовуються наступні файли. Назва файлу зліва і його опис справа:
Group Файли | Вхідний документ | Тип |
---|---|---|
Підтримка форматів файлів | Тест файл (Doc).doc | Microsoft Word 95/6.0 або Microsoft Word 97 – 2003 документ. |
Тестувати файлDot .dot |
Microsoft Word 95/6.0 або Microsoft Word 97 – 2003 шаблон. | |
Тест файл (Docx).docx | Офіс Відкритий XML-розробка ML документ без макросів. | |
Файл тесту (Docm).docm | Офіс Відкритий XML-розробка ML документ з макросом. | |
Тест файл (Dotx).dotx | Офіс Відкритий XML-розробка ML шаблон. | |
Тест файл (Dotm).dotm | Офіс Відкритий XML-розробка ML шаблон з макросом. | |
English, Українська, Français. | FlatOPC OOXML Документ. | |
Тест файл (RTF).rtf | Багатий текст Формат документа. | |
English, Українська, Français. | Microsoft Word 2003 Словообробка ML документ. | |
English, Українська, Français. | HTML документ. | |
JavaScript licenses API Веб-сайт Go1.13.8 | MHTML (Web архів) документ. | |
Тест файл (Odt).odt | OpenDocument Text (OpenOffice Writer). | |
Тест файл (Ott).ott | Шаблон документа OpenDocument. | |
Тест файл (DocPreWord60).doc | Microsoft Word 2.0 документ. | |
Зашифровані документи | Файл тесту (Enc).doc | Зашифрований Microsoft Word 95/6.0 або Microsoft Word 97 – 2003 документ. |
Тест файл (Enc).docx | Зашифрована Office Open XML Wordprocessing ML документ. | |
Не підтримується формати файлів | Файл тесту (JPG). й | Файл зображень JPEG. |