Chuyển đổi tài liệu sang PDF

Khả năng chuyển đổi tài liệu từ định dạng này sang định dạng khác một cách dễ dàng và đáng tin cậy là tính năng chính của Aspose.Words. Một trong những định dạng phổ biến nhất để chuyển đổi là PDF – định dạng bố cục cố định, giúp giữ nguyên hình thức ban đầu của tài liệu trong quá trình hiển thị trên nhiều nền tảng khác nhau. Thuật ngữ “kết xuất” được sử dụng trong Aspose.Words để mô tả quá trình chuyển đổi tài liệu sang định dạng tệp được phân trang hoặc có khái niệm về trang.

Chuyển đổi tài liệu Word sang PDF

Chuyển đổi từ Word sang PDF là một quá trình khá phức tạp, đòi hỏi nhiều giai đoạn tính toán. Công cụ bố cục Aspose.Words bắt chước cách hoạt động của công cụ bố cục trang của Microsoft Word, làm cho tài liệu đầu ra PDF trông giống nhất có thể với những gì bạn có thể thấy trong Microsoft Word.

Với Aspose.Words, bạn có thể lập trình chuyển đổi tài liệu từ các định dạng Word, chẳng hạn như DOC hoặc DOCX, sang PDF mà không cần sử dụng Microsoft Office. Bài viết này giải thích cách thực hiện chuyển đổi này.

Chuyển đổi DOCX hoặc DOC sang PDF

Việc chuyển đổi từ định dạng tài liệu DOC hoặc DOCX sang định dạng PDF trong Aspose.Words rất dễ dàng và có thể được thực hiện chỉ bằng hai dòng mã:

  1. Tải tài liệu của bạn vào đối tượng Document bằng cách sử dụng một trong các hàm tạo của nó bằng cách chỉ định tên tài liệu cùng với phần mở rộng định dạng của nó.
  2. Gọi một trong các phương thức Document.Save trên đối tượng Document và chỉ định định dạng đầu ra mong muốn là PDF bằng cách nhập tên tệp có phần mở rộng “.PDF”.

Ví dụ về mã sau đây cho thấy cách chuyển đổi tài liệu từ DOCX sang PDF bằng phương pháp Save:

Document doc = new Document(MyDir + "Document.docx");
Document doc = new Document(MyDir + "Document.docx");
doc.Save(ArtifactsDir + "BaseConversions.DocxToPdf.pdf");




Chuyển đổi sang các tiêu chuẩn PDF khác nhau

Aspose.Words cung cấp PdfTuân thủenumeration để hỗ trợ chuyển đổi DOC hoặc DOCX thành các tiêu chuẩn định dạng PDF khác nhau (chẳng hạn như PDF 1.7, PDF 1.5, v.v.).

Ví dụ về mã sau đây minh họa cách chuyển đổi tài liệu sang PDF 1.7 bằng PdfSaveOptions tuân thủ PDF17:

Document doc = new Document(MyDir + "Rendering.docx");
Document doc = new Document(MyDir + "Rendering.docx");
PdfSaveOptions saveOptions = new PdfSaveOptions { Compliance = PdfCompliance.Pdf17 };
doc.Save(ArtifactsDir + "WorkingWithPdfSaveOptions.ConversionToPdf17.pdf", saveOptions);

Chuyển đổi hình ảnh sang PDF

Việc chuyển đổi sang PDF không bị hạn chế bởi các định dạng tài liệu Microsoft Word. Bất kỳ định dạng nào được Aspose.Words hỗ trợ, bao gồm cả định dạng được tạo theo chương trình, cũng có thể được chuyển đổi sang PDF. Ví dụ: chúng tôi có thể chuyển đổi hình ảnh một trang, chẳng hạn như JPEG, PNG, BMP, EMF hoặc WMF, cũng như hình ảnh nhiều trang, chẳng hạn như TIFF và GIF, sang PDF.

Ví dụ mã sau đây cho thấy cách chuyển đổi hình ảnh JPEG và TIFF sang PDF:

// For complete examples and data files, please go to
ConvertImageToPdf(ImagesDir + "Logo.jpg", ArtifactsDir + "BaseConversions.JpgToPdf.pdf");
ConvertImageToPdf(ImagesDir + "Transparent background logo.png", ArtifactsDir + "BaseConversions.PngToPdf.pdf");
ConvertImageToPdf(ImagesDir + "Windows MetaFile.wmf", ArtifactsDir + "BaseConversions.WmfToPdf.pdf");
ConvertImageToPdf(ImagesDir + "Tagged Image File Format.tiff", ArtifactsDir + "BaseConversions.TiffToPdf.pdf");
ConvertImageToPdf(ImagesDir + "Graphics Interchange Format.gif", ArtifactsDir + "BaseConversions.GifToPdf.pdf");

// For complete examples and data files, please go to
/// <summary>
/// Converts an image to PDF using Aspose.Words for .NET.
/// </summary>
/// <param name="inputFileName">File name of input image file.</param>
/// <param name="outputFileName">Output PDF file name.</param>
public void ConvertImageToPdf(string inputFileName, string outputFileName)
Console.WriteLine("Converting " + inputFileName + " to PDF ....");
Document doc = new Document();
DocumentBuilder builder = new DocumentBuilder(doc);
// Read the image from file, ensure it is disposed.
using (Image image = Image.FromFile(inputFileName))
// Find which dimension the frames in this image represent. For example
// the frames of a BMP or TIFF are "page dimension" whereas frames of a GIF image are "time dimension".
FrameDimension dimension = new FrameDimension(image.FrameDimensionsList[0]);
int framesCount = image.GetFrameCount(dimension);
for (int frameIdx = 0; frameIdx < framesCount; frameIdx++)
// Insert a section break before each new page, in case of a multi-frame TIFF.
if (frameIdx != 0)
image.SelectActiveFrame(dimension, frameIdx);
// We want the size of the page to be the same as the size of the image.
// Convert pixels to points to size the page to the actual image size.
PageSetup ps = builder.PageSetup;
ps.PageWidth = ConvertUtil.PixelToPoint(image.Width, image.HorizontalResolution);
ps.PageHeight = ConvertUtil.PixelToPoint(image.Height, image.VerticalResolution);
// Insert the image into the document and position it at the top left corner of the page.

Để làm cho mã này hoạt động, bạn cần thêm các tham chiếu đến Aspose.Words và System.Drawing vào dự án của mình.

Giảm kích thước đầu ra PDF

Khi lưu vào PDF, bạn có thể chỉ định xem bạn có muốn tối ưu hóa đầu ra hay không. Để thực hiện việc này, bạn cần đặt cờ OptimizeOutput thành true, sau đó các khung vẽ lồng nhau dư thừa và các khung vẽ trống sẽ bị xóa, các glyph lân cận có cùng định dạng sẽ được nối.

Ví dụ mã sau đây cho thấy cách tối ưu hóa đầu ra:

Document doc = new Document(MyDir + "Rendering.docx");
Document doc = new Document(MyDir + "Rendering.docx");
PdfSaveOptions saveOptions = new PdfSaveOptions { OptimizeOutput = true };
doc.Save(ArtifactsDir + "WorkingWithPdfSaveOptions.OptimizeOutput.pdf", saveOptions);

