המרת מסמך ל- HTML, MHTML או EPUB

מסמכים ב- HTML ו- MHTML Flow-layout הם גם מאוד פופולריים וניתן להשתמש בהם בכל פלטפורמה באינטרנט. מסיבה זו, המרת מסמכים ל- HTML ו- MHTML היא תכונה חשובה. Aspose.Words.

EPUB (קיצור “פרסום אלקטרוני”) הוא פורמט מבוסס HTML המשמש בדרך כלל להפצת ספרים אלקטרוניים. פורמט זה נתמך במלואו Aspose.Words לייצא ספרים אלקטרוניים שמתאימים לרוב מכשירי הקריאה.

המרת מסמך

עבור המרה פשוטה ל-HTML, MHTML, או EPUB, אחד Save שימוש overloads. באפשרותך לשמור את המסמך לקובץ או לזרם ולהגדיר במפורש את מסמך הפלט לשמור פורמט או להגדיר אותו מהסיומת שם הקובץ.

הדוגמה הבאה מראה כיצד להמיר את DOCX ל-HTML עם ציון פורמט הצלה:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
// Load the document from disk.
Document doc = new Document(dataDir + "Test File (docx).docx");
// Save the document into HTML.
doc.save(dataDir + "Document_out.html", SaveFormat.HTML);

כדי להמיר מסמך ל- MHTML או EPUB, השתמש SaveFormat.MHTML או SaveFormat.EPUB בהתאמה.

המרת מסמך עם מידע עגול

פורמט HTML אינו תומך ברבים Microsoft Word תכונות, ואם יש צורך לשחזר מודל מסמך קרוב ככל האפשר למקור, עלינו לשמור מידע נוסף בתוך קובץ HTML. מידע זה נקרא גם “מידע מקיף”. למטרה זו, Aspose.Words מספק יכולת לייצא מידע עגול ב-HTML, MHTML או EPUB באמצעות ה-HTML. ExportRoundtripInformation רכוש. שמירת המידע העגול מאפשר לשחזר תכונות מסמך כגון כרטיסיות, הערות, ראשים, ו Footers במהלך מסמכי הטעינה של הפורמטים המפורטים בחזרה לתוך a Document אובייקט

ערך ברירת המחדל הוא true עבור HTML ו false MHTML ו- EPUB:

  • מתי true, המידע העגול ייצוא כמו - Aw - * תכונות CSS של רכיבי HTML המקבילים
  • מתי false, אין מידע עגול כדי להיות פלט לתוך קבצים המיוצרים

הדוגמה הבאה של הקוד מראה כיצד לייצא מידע עגול בעת המרת מסמך מ- DOCX ל-HTML:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
// Load the document.
Document doc = new Document(dataDir + "Test File (doc).doc");
HtmlSaveOptions options = new HtmlSaveOptions();
// HtmlSaveOptions.ExportRoundtripInformation property specifies
// whether to write the roundtrip information when saving to HTML, MHTML or
// EPUB.
// Default value is true for HTML and false for MHTML and EPUB.
options.setExportRoundtripInformation(true);
doc.save(dataDir + "ExportRoundtripInformation_out.html", options);

המונחים: save Options when Conversion to HTML

Aspose.Words מאפשר להמיר מסמך Word ל- HTML באמצעות ברירת מחדל או אפשרויות תחזוקה מותאמות אישית. כמה דוגמאות של אפשרויות חיסכון מותאם אישית מתוארות להלן.

עקבו אחרי Saving Resources

שימוש Aspose.Words אנו יכולים לציין תיקיה פיזית שבה כל המשאבים, כגון תמונות, גופן ו CSS חיצוני, נשמרים כאשר מסמך מומר ל- HTML. כברירת מחדל, זהו מחרוזת ריקה.

מציג את ResourceFolder הנכס הוא הדרך הפשוטה ביותר לקבוע את התיקיה שבה יש לכתוב את כל המשאבים. אנו יכולים להשתמש בתכונות אישיות, כגון FontsFolder אשר חוסך גופנים לתיקיה המפורטת ImagesFolder זה חוסך תמונות לתיקיה מוגדרת. כאשר דרך יחסית מוגדרת, FontsFolder ו ImagesFolder מתייחס לתיקיה שבה ממוקם ה-code. ResourceFolder ו CssStyleSheetFileName מתייחס לתיקיית הפלט שבה ממוקם מסמך HTML.

בדוגמה זו, ResourceFolder מתאר את הדרך היחסית. נתיב זה מתייחס לתיקיית הפלט שבה נשמר מסמך HTML. הערך של ResourceFolderAlias הנכס משמש ליצירת כתובות לכל המשאבים.

דוגמה לקוד הבא מראה כיצד לעבוד עם תכונות אלה:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
// The path to the document which is to be processed.
Document doc = new Document(dataDir + "Document.doc");
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setCssStyleSheetType(CssStyleSheetType.EXTERNAL);
saveOptions.setExportFontResources(true);
saveOptions.setResourceFolder(dataDir + "\\Resources");
doc.save(dataDir + "ExportResourcesUsingHtmlSaveOptions_out.html", saveOptions);

באמצעות ResourceFolderAlias נכס, אנו יכולים גם לציין את שם התיקיה המשמש לבניית URIs של כל המשאבים הכתובים במסמך HTML. זוהי הדרך הפשוטה ביותר לציין כיצד URIs צריך להיות מיוצר עבור כל קבצי משאבים. אותו מידע ניתן להציג עבור תמונות וגופנים בנפרד באמצעות ImagesFolderAlias ו FontsFolderAlias תכונות, בהתאמה.

עם זאת, אין רכוש פרטי עבור CSS. ההתנהגות של FontsFolder, FontsFolderAlias, ImagesFolder, ImagesFolderAlias ו CssStyleSheetFileName תכונות אינן משתנות. שימו לב CssStyleSheetFileName הנכס משמש גם כדי לציין שם תיקיה ושם הקובץ.

    • ResourceFolder יש עדיפות נמוכה יותר מאשר תיקיות המפורטות באמצעות FontsFolder, ImagesFolder, ו CssStyleSheetFileName. אם התיקיה המפורטת בתיקיה ResourceFolder לא קיים, הוא ייברא באופן אוטומטי.
    • ResourceFolderAlias יש עדיפות נמוכה יותר מאשר FontsFolderAlias ו ImagesFolderAlias. אם ResourceFolderAlias ריק, הערך של ResourceFolder הנכס ישמש ליצירת משאב URIs. אם ResourceFolderAlias הוא מוגדר ל" (Dot), משאב URIs רק מכיל שמות קבצים מבלי לציין דרך.

המונחים: Base64 Encoding Fonts Resources

Aspose.Words מספק יכולת לציין אם משאבים גופניים צריך להיות מוטבע לתוך HTML בבסיס64 encodings. כדי לבצע זאת, השתמש ExportFontsAsBase64 רכוש – זהו הרחבה של ExportFontResources רכוש. כברירת מחדל, ערכו הוא false, ופונטים כתובים בקבצים נפרדים. אבל אם אפשרות זו נקבעת true, גופנים יוטבעו לתוך ה- CSS של המסמך בבסיס64 encoding. The The The ייצוא Fonts AsBase64 רכוש משפיע רק על פורמט HTML ואינו משפיע על EPUB ו- MHTML.

הדוגמה הבאה לקוד מראה כיצד לייצא מגופנים ממוקודים ל-HTML:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
// The path to the document which is to be processed.
Document doc = new Document(dataDir + "Document.doc");
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
saveOptions.setExportFontResources(true);
saveOptions.setExportFontsAsBase64(true);
doc.save(dataDir + "ExportFontsAsBase64_out.html", saveOptions);

עקבו אחרי EPUB

Aspose.Words מאפשר להמיר מסמך Word לתוך פורמט EPUB באמצעות ברירת מחדל או אפשרויות שמירת מותאם אישית. אתה יכול לציין מספר אפשרויות על ידי עובר מקרה של HtmlSaveOptions אל Save שיטה.

הדוגמה הבאה של הקוד מראה כיצד להמיר מסמך Word ל- EPUB עם מפרט כמה אפשרויות תחזוקה מותאמות אישית:

// For complete examples and data files, please go to https://github.com/aspose-words/Aspose.Words-for-Java
// Open an existing document from disk.
Document doc = new Document(dataDir + "Document.EpubConversion.doc");
// Create a new instance of HtmlSaveOptions. This object allows us to set
// options that control
// how the output document is saved.
HtmlSaveOptions saveOptions = new HtmlSaveOptions();
// Specify the desired encoding.
saveOptions.setEncoding(Charset.forName("UTF-8"));
// Specify at what elements to split the internal HTML at. This creates a new
// HTML within the EPUB
// which allows you to limit the size of each HTML part. This is useful for
// readers which cannot read
// HTML files greater than a certain size e.g 300kb.
saveOptions.setDocumentSplitCriteria(DocumentSplitCriteria.HEADING_PARAGRAPH);
// Specify that we want to export document properties.
saveOptions.setExportDocumentProperties(true);
// Specify that we want to save in EPUB format.
saveOptions.setSaveFormat(SaveFormat.EPUB);
// Export the document as an EPUB file.
doc.save(dataDir + "Document.EpubConversion_out.epub", saveOptions);

ראה גם