从 URL 保存文件(Python)

从 URL 保存文件是一项实用技能,可让您下载并存储文件,以便离线访问、共享或归档。

本文将向您展示如何使用 Aspose.HTML Python 库的网络功能,将文件从 URL 下载并保存到本地文件系统。

如何从 URL 保存文件

要从 URL 保存文件,您需要知道文件的 URL 并使用适当的网络操作处理器。Aspose.HTML for Python via .NET 提供了便捷的 API 来处理网络请求。以下是使用该库保存文件的步骤:

  1. 使用默认的 HTMLDocument() 构造函数创建一个空的 HTML 文档。虽然文档本身不直接参与网络操作,但它提供了访问 document.context.network 对象的入口。
  2. 使用 Url 类实例化对象,传入要保存的资源路径。
  3. 使用 RequestMessage(uri) 构造函数创建一个 RequestMessage 实例,表示要发送的网络请求。uri 参数即为目标 URL。
  4. 调用 document.context.network.send(message) 方法发送网络请求并获取响应。检查响应是否成功。
  5. 若响应成功,构建本地文件路径,并使用 response.content.read_as_byte_array() 将内容写入二进制文件。
 1# Download file from URL using Python
 2
 3import os
 4import aspose.html as ah
 5import aspose.html.net as ahnet
 6
 7# Define output directory
 8output_dir = "output/"
 9os.makedirs(output_dir, exist_ok=True)
10
11# Create a blank document
12doc = ah.HTMLDocument()
13
14# Create a URL with the path to the resource you want to save
15url = ah.Url("https://docs.aspose.com/html/images/handlers/message-handlers.png")
16
17# Create a file request message
18request = ahnet.RequestMessage(url)
19
20# Extract file from URL
21response = doc.context.network.send(request)
22
23# Check whether the response is successful
24if response.is_success:
25    # Save the file to a local file system
26    file_path = os.path.join(output_dir, os.path.basename(url.pathname))
27    with open(file_path, "wb") as file:
28        file.write(response.content.read_as_byte_array())

为什么要保存文件

下载并安装 Aspose.HTML for Python via .NET下载链接),即可使用上述 API 轻松操作 HTML 文档、网络请求以及文件保存。该库支持多种文件格式(EPUB、MHTML、XML、SVG、Markdown 等),并可将文档渲染为 PDF、DOCX、XPS 以及图像文件。

您还可以从 GitHub 获取完整的示例和数据文件。

Aspose.HTML 提供一套免费在线工具 HTML Web Applications,包括转换器、合并器、SEO 工具、代码生成器等,适用于任何带浏览器的操作系统,无需额外安装软件。

Text “HTML Web Applications”

Subscribe to Aspose Product Updates

Get monthly newsletters & offers directly delivered to your mailbox.