לזהות קובץ פורמט ולבדוק פורמט תאימות
לפעמים יש צורך לקבוע את הפורמט של מסמך לפני הפתיחה מכיוון שסיומת הקובץ אינה מבטיחה שתוכן הקובץ מתאים. לדוגמה, ידוע כי דוחות קריסטל לעתים קרובות מוציאים מסמכים בפורמט RTF, אבל נותן להם את .הארכת דוק.
Aspose.Words מספק יכולת לקבל מידע על סוג הקובץ על מנת למנוע חריג אם אינך בטוח מהו התוכן בפועל של הקובץ.
זיהוי פורמט קובץ ללא יוצא מן הכלל
כאשר אתה מתמודד עם מספר מסמכים בפורמטים שונים של קבצים, ייתכן שיהיה עליך להפריד את הקבצים שניתן לעבד על ידי Aspose.Words מאלה שאינם יכולים. ייתכן שתרצה גם לדעת מדוע לא ניתן לעבד חלק מהמסמכים.
אם תנסה לטעון קובץ לאובייקט Document ו Aspose.Words לא תוכל לזהות את פורמט הקובץ או שהפורמט אינו נתמך, Aspose.Words יזרוק חריג. אתה יכול לתפוס את החריגים האלה ולנתח אותם, אבל Aspose.Words מספק גם את שיטת DetectFileFormat המאפשרת לנו לקבוע במהירות את פורמט הקובץ מבלי לטעון מסמך עם חריגים אפשריים. שיטה זו מחזירה אובייקט FileFormatInfo המכיל את המידע שזוהה על סוג הקובץ.
בדוק תאימות פורמט קבצים
אנו יכולים לבדוק את תאימות הפורמט של כל הקבצים בתיקיה שנבחרה ולמיין אותם לפי פורמט לתיקיות משנה מתאימות.
מכיוון שאנו עוסקים בתוכן בתיקיה, הדבר הראשון שעלינו לעשות הוא לקבל אוסף של כל הקבצים בתיקיה זו בשיטת GetFiles של המחלקה Directory
(ממרחב השמות System.IO
).
דוגמת הקוד הבאה מראה כיצד לקבל רשימה של כל הקבצים בתיקיה:
כאשר כל הקבצים נאספים, שאר העבודה נעשית בשיטת DetectFileFormat, הבודקת את פורמט הקובץ.
דוגמת הקוד הבאה מראה כיצד לחזור על רשימת הקבצים שנאספה, לבדוק את הפורמט של כל קובץ ולהעביר כל קובץ לתיקיה המתאימה:
הקבצים מועברים לתיקיות משנה מתאימות בשיטת Move
של הכיתה File
, מאותו מרחב שמות System.IO
.
הקבצים הבאים משמשים בדוגמה לעיל. שם הקובץ נמצא בצד שמאל והתיאור שלו בצד ימין:
קבוצת קבצים | מסמך קלט | סוג |
---|---|---|
פורמטים של קבצים נתמכים | Test File (DOC).doc | Microsoft Word 95 / 6.0 או Microsoft Word 97 – 2003 מסמך. |
Test File (DOT).dot | Microsoft Word 95 / 6.0 או Microsoft Word 97 – 2003 תבנית. | |
Test File (DOCX).docx | משרד פתוח XML WordprocessingML מסמך ללא פקודות מאקרו. | |
Test File (DOCM).docm | משרד פתוח XML WordprocessingML מסמך עם פקודות מאקרו. | |
Test File (DOTX).dotx | משרד פתוח XML WordprocessingML תבנית. | |
Test File (DOTM).dotm | משרד פתוח XML WordprocessingML תבנית עם פקודות מאקרו. | |
Test File (XML).xml | FlatOPC OOXML מסמך. | |
Test File (RTF).rtf | מסמך בפורמט טקסט עשיר. | |
Test File (WordML).xml | Microsoft Word 2003 WordprocessingML מסמך. | |
Test File (HTML).html | HTML מסמך. | |
Test File (MHTML).mhtml | MHTML (ארכיון אינטרנט) מסמך. | |
Test File (ODT).odt | OpenDocument טקסט (OpenOffice סופר). | |
Test File (OTT).ott | OpenDocument תבנית מסמך. | |
Test File (DocPreWord60).doc | Microsoft Word 2.0 מסמך. | |
מסמכים מוצפנים | Test File (Enc).doc | מוצפן Microsoft Word 95 / 6.0 או Microsoft Word 97 – 2003 מסמך. |
Test File (Enc).docx | משרד מוצפן פתוח XML WordprocessingML מסמך. | |
פורמטים של קבצים שאינם נתמכים | Test File (JPG).jpg | JPEG קובץ תמונה. |