Định dạng và chuyển đổi tệp

Khả năng chuyển đổi nhanh chóng và đáng tin cậy các định dạng tài liệu khác nhau với độ chính xác cao là tính năng hàng đầu của Aspose.Words. Đây thường là lý do đủ chính đáng để chọn Aspose.Words cho Python via .NET.

Với Aspose.Words, bạn có thể chuyển đổi tài liệu từ bất kỳ định dạng tải được hỗ trợ nào sang bất kỳ định dạng lưu được hỗ trợ nào chỉ bằng hai dòng mã:

  1. Tải tài liệu từ một tệp hoặc luồng
  2. Lưu nó vào bất kỳ định dạng được hỗ trợ

Ví dụ mã sau đây cho thấy cách chuyển đổi tài liệu:

Để biết thêm chi tiết về cách tải, chuyển đổi và lưu tài liệu, hãy xem phần Đang tải, lưu và chuyển đổi.

Độ trung thực cao

Một trong những mục tiêu chính của Aspose.Words là cung cấp khả năng chuyển đổi có độ chính xác cao giữa các định dạng tài liệu. Chúng tôi sử dụng từ “độ trung thực cao” để mô tả các chuyển đổi trong đó tài liệu đầu ra giữ lại tất cả nội dung và định dạng của bản gốc.

Các định dạng tài liệu xử lý văn bản hiện đại rất phức tạp và bao gồm hàng trăm tính năng. Đôi khi, khi nhà cung cấp tuyên bố rằng giải pháp của họ hỗ trợ một định dạng tài liệu cụ thể – điều đó có nghĩa là chỉ hỗ trợ các tính năng cơ bản của định dạng đó. Ví dụ: tài liệu Microsoft Word có các tính năng nâng cao như chú thích cuối trang, hộp văn bản, hình dạng tự động, đối tượng OLE, trường và thuộc tính định dạng nâng cao. Nhiều phần tử trong số này thường bị bỏ qua trong các thư viện xử lý tài liệu, nhưng không có trong Aspose.Words.

Hỗ trợ định dạng ở mức độ lớn hơn

Ưu điểm không thể chối cãi của Aspose.Words là khả năng hỗ trợ tuyệt vời cho hầu hết các định dạng phổ biến. Rất khó hoặc không thể tìm được mức hỗ trợ tương tự cho nhiều tính năng quan trọng ở nơi khác.

Khi mua giải pháp hỗ trợ một định dạng cụ thể, hãy tìm hiểu mức độ hỗ trợ các tính năng của định dạng này. Để kiểm tra, hãy tạo một tệp phức tạp và chạy nó thông qua giải pháp được đề xuất. Bạn sẽ thường thấy rằng nhiều thành phần và định dạng tài liệu sẽ bị mất. Ví dụ: đối với định dạng DOC, hình dạng, hộp văn bản, trường, cột, đối tượng OLE, bản sửa đổi, văn bản từ phải sang trái thường bị ảnh hưởng.

Aspose.Words Document Object Model (DOM) được thiết kế dành cho các định dạng tài liệu Microsoft Word. Do đó, mức độ hỗ trợ của chúng tôi đối với các định dạng đó, chẳng hạn như DOC, DOCX, RTF hoặc WordprocessingML, là chưa từng có. Chuyển đổi theo bất kỳ hướng nào giữa các định dạng này có độ trung thực cao.

Khi chạy một tài liệu phức tạp thông qua Aspose.Words, hãy tận hưởng sự hoàn thiện chưa từng có của việc triển khai định dạng.

Ví dụ chuyển đổi giữa các định dạng phổ biến

Dưới đây là ví dụ về chuyển đổi giữa một số định dạng phổ biến. Bạn có thể đánh giá mức độ chính xác của Aspose.Words đối phó với nhiệm vụ.


DOC sang RTF – chuyển đổi độ chính xác cao:

doc-to-rtf-aspose-words-net-1doc-to-rtf-aspose-words-net-2


DOC sang PDF – chuyển đổi có độ chính xác cao:

doc-to-pdf-aspose-words-net-1doc-to-pdf-aspose-words-net-2

doc-to-pdf-aspose-words-net-3doc-to-pdf-aspose-words-net-4


DOC sang ODT – chuyển đổi độ chính xác cao:

doc-to-odt-aspose-words-net-1doc-to-odt-aspose-words-net-2


DOC sang XPS – chuyển đổi độ chính xác cao:

doc-to-xps-aspose-words-net-1doc-to-xps-aspose-words-net-2


DOC sang PostScript – chuyển đổi có độ chính xác cao:

doc-to-postscript-aspose-words-net-1doc-to-postscript-aspose-words-net-2


DOC sang JPEG – chuyển đổi độ trung thực cao:

doc-to-jpeg-aspose-words-net-1

DOC sang GIF – chuyển đổi có độ trung thực cao:

doc-to-gif-aspose-words-net-1

RTF sang TXT – chuyển đổi có độ chính xác cao:

rtf-to-txt-aspose-words-net-1rtf-to-txt-aspose-words-net-2


Mặc dù tất cả các trình chuyển đổi trong Aspose.Words đều tuyệt vời nhưng đôi khi bạn sẽ không thể có được giao diện giống nhau cho các tài liệu ở các định dạng khác nhau.

Ví dụ: không có sự trùng khớp đơn giản nào giữa tất cả các tính năng của tài liệu HTML và Microsoft Word. Không có đầu trang/chân trang, phần, trường và tab trong HTML. Ngược lại, không phải tất cả các thuộc tính và quy tắc CSS đều có thể được ánh xạ tới tài liệu Microsoft Word.

Dưới đây là ví dụ về chuyển đổi từ DOC sang HTML.


DOC sang HTML – chuyển đổi có độ chính xác cao:

doc-to-html-aspose-words-net-1doc-to-html-aspose-words-net-2

doc-to-html-aspose-words-net-3doc-to-html-aspose-words-net-4


Khả năng mở rộng cao

Các kịch bản phía máy chủ có thể mở rộng sử dụng Aspose.Words chủ yếu vì thiết kế đơn giản và rõ ràng của nó – Aspose.Words hỗ trợ đa luồng. Các đối tượng Document độc lập với nhau và miễn là mỗi lần chỉ có một luồng có thể sửa đổi tài liệu (yêu cầu điển hình cho bất kỳ lớp bộ sưu tập nào), nhiều luồng có thể xử lý bất kỳ số lượng tài liệu nào cùng một lúc.

Hiệu suất cao

Aspose.Words thể hiện hiệu suất cao khi tải và lưu tài liệu. Trong thử nghiệm, tệp DOC có kích thước trên 5Mb được tải trong chưa đầy 1 giây và sau đó được lưu trong chưa đầy 1 giây trên máy P4 3GHz. Các tệp nhỏ hơn có thể được xử lý ở tốc độ hàng nghìn mỗi phút.

Trong một số trường hợp, khách hàng đã báo cáo với chúng tôi rằng họ không thể tin được tốc độ của Aspose.Words. Họ đã bỏ qua dòng mã đang tải một tài liệu khổng lồ vào trình gỡ lỗi và nó diễn ra tức thời đến mức họ không thể tin rằng tệp đã được tải vào đối tượng Document.