Convertir HTML a DOCX

Un archivo DOCX es un documento de Microsoft Word que normalmente contiene texto, pero puede contener una amplia gama de datos, incluidas tablas, gráficos rasterizados y vectoriales, vídeos, sonidos y diagramas. El archivo DOCX es altamente editable, fácil de usar y de tamaño manejable. Este formato es popular por la variedad de opciones que ofrece a los usuarios para redactar cualquier tipo de documento.

Usar los métodos Converter.convert_html() es la forma más común de convertir código HTML a varios formatos. Con Aspose.HTML for Python via .NET, puede convertir HTML a formato DOCX mediante programación con control total sobre una amplia gama de parámetros de conversión. En este artículo, encontrará información sobre cómo convertir HTML a DOCX usando los métodos convert_html() de la clase Converter y cómo aplicar DocSaveOptions. Además, puede probar un convertidor HTML en línea para probar la funcionalidad Aspose.HTML y convertir HTML sobre la marcha.

Para continuar siguiendo este tutorial, instale y configure Aspose.HTML for Python via .NET en su proyecto Python. Nuestros ejemplos de código le ayudan a convertir HTML a DOCX utilizando la biblioteca Python.

Convertidor HTML en línea

Puede probar la funcionalidad de Aspose.HTML for Python via .NET API y realizar conversiones HTML en tiempo real. Cargue un archivo HTML desde su sistema local o una URL, seleccione el formato de salida deseado y ejecute el ejemplo. Se aplican las opciones de guardado predeterminadas y recibirás el archivo convertido al instante.

                
            

Convertir HTML a DOCX: ejemplos de código Python

Convertir HTML a otro formato usando el método convert_html() es una secuencia de operaciones entre las que se encuentran cargar y guardar documentos:

  1. Cargue un archivo HTML usando la clase HTMLDocument.
  2. Cree un nuevo objeto DocSaveOptions. La clase DocSaveOptions proporciona numerosas propiedades que le brindan control total sobre una amplia gama de parámetros y mejoran el proceso de conversión de HTML a formato DOCX.
  3. Utilice uno de los métodos convert_html() para guardar HTML como un archivo DOCX. En el siguiente ejemplo, debe pasar HTMLDocument, DocSaveOptions y la ruta del archivo de salida al método convert_html().

HTML a DOCX mediante una sola línea de código

Los métodos estáticos de la clase Converter se utilizan principalmente como la forma más sencilla de convertir un código HTML a varios formatos. ¡Puedes convertir HTML a DOCX en tu aplicación Python literalmente con una sola línea de código!

1from aspose.html import *
2from aspose.html.converters import *
3from aspose.html.saving import *
4
5# Convert HTML to DOCX
6Converter.convert_html("document.html", DocSaveOptions(), "document.docx")

Convierta HTML a DOCX usando DocSaveOptions

Repasemos el siguiente fragmento de código de Python, que muestra el proceso de conversión de HTML a DOCX con DocSaveOptions especificando:

 1import os
 2from aspose.html import *
 3from aspose.html.saving import *
 4from aspose.html.drawing import *
 5from aspose.html.converters import *
 6from aspose.html.rendering.doc import *
 7
 8# Setup directories and define paths
 9output_dir = "output/"
10input_dir = "data/"
11if not os.path.exists(output_dir):
12    os.makedirs(output_dir)
13
14document_path = os.path.join(input_dir, "document.html")
15save_path = os.path.join(output_dir, "output1.docx")
16
17# Initialize an HTML document from the file
18document = HTMLDocument(document_path)
19
20# Initialize DocSaveOptions
21options = DocSaveOptions()
22
23# Customize save options for DOCX
24options.document_format.DOCX
25options.font_embedding_rule.FULL
26options.css.media_type.PRINT
27options.horizontal_resolution = Resolution.from_dots_per_inch(96.0)
28options.vertical_resolution = Resolution.from_dots_per_inch(96.0)
29
30# Convert HTML to DOCX
31Converter.convert_html(document, options, save_path)
32
33print(f"HTML document converted to DOCX successfully and saved to {save_path}")

Convertimos un documento HTML a un archivo DOCX usando las opciones de guardar en este ejemplo. El proceso implica inicializar el documento HTML, configurar opciones de guardado personalizadas, como el formato del documento, la regla de incrustación de fuentes, el tipo de medio CSS y la resolución, y luego realizar la conversión. Finalmente, el archivo DOCX convertido se guarda en un directorio de salida específico.

Opciones de guardado – Clase DocSaveOptions

La clase DocSaveOptions es una poderosa herramienta de configuración que le permite ajustar la conversión de documentos HTML al formato DOCX. Algunas propiedades de esta clase heredan propiedades de las clases base, como DocRenderingOptions o RenderingOptions. DocSaveOptions está configurado para guardar el documento como DOCX e incluye las siguientes propiedades:

Descargue la biblioteca Aspose.HTML for Python via .NET para convertir exitosa, rápida y fácilmente sus documentos HTML, MHTML, EPUB, SVG y Markdown a los formatos más populares.

Aspose.HTML ofrece un Convertidor de HTML a DOCX en línea gratuito que convierte HTML a DOCX con alta calidad, fácil y rápido. ¡Simplemente cargue, convierta sus archivos y obtenga resultados en unos segundos!

Texto “Convertidor de HTML a DOCX”

Subscribe to Aspose Product Updates

Get monthly newsletters & offers directly delivered to your mailbox.