ตรวจสอบรูปแบบไฟล์และตรวจสอบความเข้ากันได้ของรูปแบบ

บางครั้งก็เป็นสิ่งจำเป็นในการกำหนดรูปแบบของเอกสารก่อนที่จะเปิดเพราะนามสกุลขอ ตัวอย่างเช่นเป็นที่รู้จักกันว่ารายงานคริสตัลมักจะแสดงผลเอกสารในรูปแบบRTFแต่ให้พวกเขนามสกุล.

Aspose.Wordsให้ความสามารถในการรับข้อมูลเกี่ยวกับชนิดแฟ้มเพื่อหลีกเลี่ยงข้อยกเว้นถ้าคุณไม่แน่ใจ.

ตรวจหารูปแบบไฟล์โดยไม่มีข้อยกเว้น

เมื่อคุณจัดการกับเอกสารหลายฉบับในรูปแบบไฟล์ต่างๆ คุณอาจต้องแยกไฟล์ที่สามารถประมวลผลโดย Aspose.Words ออกจากไฟล์ที่ไม่สามารถประมวลผลได้ นอกจากนี้ คุณอาจต้องการทราบว่าเหตุใดจึงไม่สามารถประมวลผลเอกสารบางฉบับได้.

หากคุณพยายามโหลดแฟ้มลงในวัตถุDocumentและAspose.Wordsไม่สามารถรับรู้รูปแบบแฟ้มได้หรือไม่รองรับรูปแบบAspose.Wordsจะโยนข้อยกเว้น คุณสามารถจับข้อยกเว้นเหล่านั้นและวิเคราะห์ได้แต่Aspose.WordsมีวิธีการDetectFileFormatที่ช่วยให้เราสามารถกำหนดรูปแบบไฟล์ได้อย่างรวดเร็วโดยไม่ต้องโหลดเอกสารที่มีข้อยกเว้นที่เป็นไปได้ วิธีนี้ส่งกลับวัตถุFileFormatInfoที่มีข้อมูลที่ตรวจพบเกี่ยวกับชนิดแฟ้ม.

ตรวจสอบความเข้ากันได้ของรูปแบบไฟล์

เราสามารถตรวจสอบความเข้ากันได้ของรูปแบบของไฟล์ทั้งหมดในโฟลเดอร์ที่เลือกและ.

เนื่องจากเรากำลังจัดการกับเนื้อหาในโฟลเดอร์,สิ่งแรกที่เราต้องทำคือการได้รับคอลเลกชันของไฟล์ทั้งหมดในโฟลเดอร์นี้โดยใช้วิธีการGetFilesของDirectoryชั้น(จากSystem.IOเนมสเปซ).

ตัวอย่างรหัสต่อไปนี้แสดงวิธีการรับรายการของแฟ้มทั้งหมดในโฟลเดอร์:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
File[] fileList = new File(dataDir).listFiles();

เมื่อไฟล์ทั้งหมดถูกรวบรวมแล้วส่วนที่เหลือของงานจะดำเนินการโดยวิธีการDetectFileFormatซึ่งจะตรวจ.

ตัวอย่างรหัสต่อไปนี้แสดงวิธีการทำซ้ำรายการเก็บรวบรวมของแฟ้มตรวจสอบรูปแบบของแ:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
// The path to the documents directory.
String dataDir = Utils.getDataDir(CheckFormatCompatibility.class);
String supportedDir = dataDir + "OutSupported" + File.separator;
String unknownDir = dataDir + "OutUnknown" + File.separator;
String encryptedDir = dataDir + "OutEncrypted" + File.separator;
String pre97Dir = dataDir + "OutPre97" + File.separator;
File[] fileList = new File(dataDir).listFiles();
// Loop through all found files.
for (File file : fileList) {
if (file.isDirectory())
continue;
// Extract and display the file name without the path.
String nameOnly = file.getName();
System.out.print(nameOnly);
// Check the file format and move the file to the appropriate folder.
String fileName = file.getPath();
FileFormatInfo info = FileFormatUtil.detectFileFormat(fileName);
// Display the document type.
switch (info.getLoadFormat()) {
case LoadFormat.DOC:
System.out.println("\tMicrosoft Word 97-2003 document.");
break;
case LoadFormat.DOT:
System.out.println("\tMicrosoft Word 97-2003 template.");
break;
case LoadFormat.DOCX:
System.out.println("\tOffice Open XML WordprocessingML Macro-Free Document.");
break;
case LoadFormat.DOCM:
System.out.println("\tOffice Open XML WordprocessingML Macro-Enabled Document.");
break;
case LoadFormat.DOTX:
System.out.println("\tOffice Open XML WordprocessingML Macro-Free Template.");
break;
case LoadFormat.DOTM:
System.out.println("\tOffice Open XML WordprocessingML Macro-Enabled Template.");
break;
case LoadFormat.FLAT_OPC:
System.out.println("\tFlat OPC document.");
break;
case LoadFormat.RTF:
System.out.println("\tRTF format.");
break;
case LoadFormat.WORD_ML:
System.out.println("\tMicrosoft Word 2003 WordprocessingML format.");
break;
case LoadFormat.HTML:
System.out.println("\tHTML format.");
break;
case LoadFormat.MHTML:
System.out.println("\tMHTML (Web archive) format.");
break;
case LoadFormat.ODT:
System.out.println("\tOpenDocument Text.");
break;
case LoadFormat.OTT:
System.out.println("\tOpenDocument Text Template.");
break;
case LoadFormat.DOC_PRE_WORD_60:
System.out.println("\tMS Word 6 or Word 95 format.");
break;
case LoadFormat.UNKNOWN:
default:
System.out.println("\tUnknown format.");
break;
}
// Now copy the document into the appropriate folder.
if (info.isEncrypted()) {
System.out.println("\tAn encrypted document.");
fileCopy(fileName, new File(encryptedDir, nameOnly).getPath());
} else {
switch (info.getLoadFormat()) {
case LoadFormat.DOC_PRE_WORD_60:
fileCopy(fileName, new File(pre97Dir + nameOnly).getPath());
break;
case LoadFormat.UNKNOWN:
fileCopy(fileName, new File(unknownDir + nameOnly).getPath());
break;
default:
fileCopy(fileName, new File(supportedDir + nameOnly).getPath());
break;
}
}
}

แฟ้มจะถูกย้ายไปยังโฟลเดอร์ย่อยที่เหมาะสมโดยใช้วิธีการMoveของคลาสของFileจากเนมสเปซSystem.IOเดียวกัน.

ไฟล์ต่อไปนี้จะใช้ในตัวอย่างข้างต้น ชื่อไฟล์อยู่ทางด้านซ้ายและคำอธิบายของมันอยู่ทางด้านขวา:

กลุ่มของไฟล์ ป้อนเอกสาร ชนิด
รูปแบบไฟล์ที่รองรับ Test File (Doc).doc Microsoft Word95/6.0หรือMicrosoft Word97–2003 เอกสาร.
Test File (Dot).dot Microsoft Word95/6.0หรือMicrosoft Word97–2003 เทมเพลต.
Test File (Docx).docx เปิดสำนักงานXMLWordprocessingMLเอกสารที่ไม่มีแมโคร.
Test File (Docm).docm เปิดสำนักงานXMLWordprocessingMLเอกสารที่มีมาโคร.
Test File (Dotx).dotx เปิดสำนักงานXMLWordprocessingMLเทมเพลต.
Test File (Dotm).dotm สำนักงานเปิดXMLWordprocessingMLเทมเพลตที่มีมาโคร.
Test File (XML).xml FlatOPCOOXMLเอกสาร.
Test File (RTF).rtf เอกสารรูปแบบข้อความที่อุดมไปด้วย.
Test File (WordML).xml Microsoft Word2003WordprocessingMLเอกสาร.
Test File (HTML).html HTMLเอกสาร.
Test File (MHTML).mhtml MHTML(เก็บเว็บ)เอกสาร.
Test File (Odt).odt OpenDocumentข้อความ(OpenOfficeผู้เขียน).
Test File (Ott).ott เทมเพลตเอกสารOpenDocument.
Test File (DocPreWord60).doc Microsoft Word2.0เอกสาร.
เอกสารที่เข้ารหัส Test File (Enc).doc เข้ารหัสMicrosoft Word95/6.0หรือMicrosoft Word97–2003 เอกสาร.
Test File (Enc).docx เปิดสำนักงานเข้ารหัสไว้XMLWordprocessingMLเอกสาร.
รูปแบบไฟล์ที่ไม่สนับสนุน Test File (JPG).jpg แฟ้มรูปภาพJPEG.