Analyzing your prompt, please hold on...
An error occurred while retrieving the results. Please refresh the page and try again.
Supongamos que es un desarrollador web, diseñador gráfico, investigador, periodista o estudiante, en una palabra, una persona que trabaja en su propio proyecto. En ese caso, obviamente necesitarás imágenes para tu proyecto en el proceso de desarrollo. Para descargar imágenes de un sitio web manualmente, se necesita mucho tiempo. Tendrá que copiar la URL de cada imagen y luego guardarla, pero puede usar la biblioteca Aspose.HTML for .NET para extraer imágenes del sitio web mediante programación.
En este artículo, veremos cómo extraer de un sitio web varios tipos de imágenes utilizando Aspose.HTML for .NET API. El uso de nuestra biblioteca C# le ayudará a descargar imágenes del sitio web. Es mejor que cavar y buscarlos manualmente. ¡Intentémoslo! ¡Extraiga imágenes del sitio web mediante programación!
La mayoría de las imágenes en un documento HTML se representan mediante el elemento <img>. A continuación se muestra un ejemplo de cómo utilizar Aspose.HTML for .NET para buscar imágenes especificadas por este elemento. Entonces, para descargar imágenes del sitio web, debes seguir algunos pasos:
HTMLDocument y pásele la URL del sitio web desde el que desea buscar imágenes.<img>. El método devuelve una lista de los elementos <img> del documento HTML.Select() para crear una colección distinta de URL de imágenes relativas y el método
GetAttribute(src) para extraer el atributo src de cada elemento <img>.HTMLDocument.File.WriteAllBytes() para guardar cada imagen en un archivo local. 1// Extract images from website using C#
2
3// Open a document you want to download images from
4using HTMLDocument document = new HTMLDocument("https://docs.aspose.com/svg/net/drawing-basics/svg-shapes/");
5
6// Collect all <img> elements
7HTMLCollection images = document.GetElementsByTagName("img");
8
9// Create a distinct collection of relative image URLs
10IEnumerable<string> urls = images.Select(element => element.GetAttribute("src")).Distinct();
11
12// Create absolute image URLs
13IEnumerable<Url> absUrls = urls.Select(src => new Url(src, document.BaseURI));
14
15foreach (Url url in absUrls)
16{
17 // Create an image request message
18 using RequestMessage request = new RequestMessage(url);
19
20 // Extract image
21 using ResponseMessage response = document.Context.Network.Send(request);
22
23 // Check whether a response is successful
24 if (response.IsSuccess)
25 {
26 // Save image to a local file system
27 File.WriteAllBytes(Path.Combine(OutputDir, url.Pathname.Split('/').Last()), response.Content.ReadAsByteArray());
28 }
29}Nota: Es importante cumplir con las leyes de derechos de autor y obtener el permiso o la licencia adecuados antes de utilizar imágenes guardadas con fines comerciales. No apoyamos la extracción de datos ni el uso de archivos de otras personas con fines comerciales sin su permiso.
Los iconos son un tipo de imagen en documentos HTML que se especifican mediante elementos <link> con el atributo rel establecido en icon. Veamos cómo extraer íconos de un sitio web usando la biblioteca Aspose.HTML for .NET:
HTMLDocument y pásele la URL del sitio web del que desea extraer iconos.<link>.Where() que filtra la colección según la expresión link => link.GetAttribute("rel") == "icon". Por lo tanto, la colección iconos contendrá sólo links con un atributo rel con el valor icon.Select() para crear una colección distinta de URL de iconos relativos y el método
GetAttribute(“href”) para extraer el atributo href de cada elemento <link>.HTMLDocument.File.WriteAllBytes() para guardar iconos en un archivo local. Como resultado, tendrá una colección de íconos del sitio web en su carpeta local. 1// Download icons from website using C#
2
3// Open a document you want to download icons from
4using HTMLDocument document = new HTMLDocument("https://docs.aspose.com/html/net/message-handlers/");
5
6// Collect all <link> elements
7HTMLCollection links = document.GetElementsByTagName("link");
8
9// Leave only "icon" elements
10IEnumerable<Element> icons = links.Where(link => link.GetAttribute("rel") == "icon");
11
12// Create a distinct collection of relative icon URLs
13IEnumerable<string> urls = icons.Select(icon => icon.GetAttribute("href")).Distinct();
14
15// Create absolute icon URLs
16IEnumerable<Url> absUrls = urls.Select(src => new Url(src, document.BaseURI));
17
18foreach (Url url in absUrls)
19{
20 // Create a downloading request
21 using RequestMessage request = new RequestMessage(url);
22
23 // Extract icon
24 using ResponseMessage response = document.Context.Network.Send(request);
25
26 // Check whether a response is successful
27 if (response.IsSuccess)
28 {
29 // Save icon to a local file system
30 File.WriteAllBytes(Path.Combine(OutputDir, url.Pathname.Split('/').Last()), response.Content.ReadAsByteArray());
31 }
32}Puede utilizar estos ejemplos de C# para automatizar la extracción de todas las imágenes del sitio web, lo que puede resultar útil para tareas como archivar, investigar, analizar contenido web o cualquier otra aplicación de uso personal. Además, esto es excelente para diseñadores y desarrolladores web que desean extraer imágenes de sitios sin profundizar en el código fuente.
Puede descargar los ejemplos completos de C# y los archivos de datos desde GitHub.
Aspose.HTML ofrece Aplicaciones web HTML que son una colección en línea de convertidores, fusiones, herramientas de SEO, generadores de código HTML, herramientas de URL y más gratuitos. Las aplicaciones funcionan en cualquier sistema operativo con un navegador web y no requieren ninguna instalación de software adicional. Convierta, fusione, codifique, genere código HTML, extraiga datos de la web o analice páginas web en términos de SEO fácilmente dondequiera que esté. Utilice nuestra colección de aplicaciones web HTML para realizar sus asuntos diarios y hacer que su flujo de trabajo sea fluido.
Analyzing your prompt, please hold on...
An error occurred while retrieving the results. Please refresh the page and try again.