Analyzing your prompt, please hold on...
An error occurred while retrieving the results. Please refresh the page and try again.
Wenn Sie Webentwickler, Grafikdesigner, Forscher, Journalist, Student oder einfach nur an einem persönlichen Projekt arbeiten, benötigen Sie wahrscheinlich Bilder und die Möglichkeit, diese von Websites zu sammeln. Das manuelle Speichern von Bildern – das Kopieren jeder URL und das Herunterladen einer nach der anderen – kann zeitaufwändig und ineffizient sein. Mit der Aspose.HTML for Java Bibliothek können Sie diesen Prozess jedoch automatisieren und Bilder programmgesteuert aus einer Website extrahieren.
In diesem Artikel wird untersucht, wie man verschiedene Arten von Bildern aus einer Website programmatisch mit Java extrahieren kann. Mit Aspose.HTML for Java können Sie ganz einfach ein Tool erstellen, das eine HTML-Seite analysiert, Bildquellen identifiziert und diese Bilder herunterlädt. Es ist eine leistungsstarke Lösung für jeden, der Bilder für die Analyse, Archivierung oder die Erstellung von Inhalten sammeln muss – ohne die Mühe, dies manuell zu tun.
Die meisten Bilder in einem HTML-Dokument werden durch das Element <img> dargestellt. Das folgende Code-Snippet zeigt, wie man Aspose.HTML for Java verwendet, um Bilder zu finden, die durch dieses Element angegeben werden. Um also Bilder von einer Website herunterzuladen, sollten Sie einige der folgenden Schritte ausführen:
HTMLDocument zu erstellen und übergeben Sie die URL der Webseite, die Sie verarbeiten wollen.<img> Elemente aus dem Dokument zu erhalten. Die Methode gibt eine Sammlung von <img>-Elementen zurück, die auf der Seite vorhanden sind.<img> Elemente und verwenden Sie die
getAttribute(“src”) Methode, um den Wert des src Attributs jedes Bildes zu erhalten. Jedes src wird zu dem urls Satz hinzugefügt.BaseURI des Dokuments, um relative Bildpfade in absolute URLs umzuwandeln.document.getContext().getNetwork().send(request). Dies gibt eine ResponseMessage zurück.response.getContent().readAsByteArray() und speichern Sie sie in Ihrem lokalen Dateisystem mit FileHelper.writeAllBytes(). 1// Extract images from website using Java
2
3// Open a document you want to download images from
4final HTMLDocument document = new HTMLDocument("https://docs.aspose.com/svg/net/drawing-basics/svg-shapes/");
5
6// Collect all <img> elements
7HTMLCollection images = document.getElementsByTagName("img");
8
9// Create a distinct collection of relative image URLs
10Iterator<Element> iterator = images.iterator();
11java.util.Set<String> urls = new HashSet<>();
12for (Element e : images) {
13 urls.add(e.getAttribute("src"));
14}
15
16// Create absolute image URLs
17java.util.List<Url> absUrls = urls.stream()
18 .map(src -> new Url(src, document.getBaseURI()))
19 .collect(Collectors.toList());
20
21// foreach to while statements conversion
22for (Url url : absUrls) {
23 // Create an image request message
24 final RequestMessage request = new RequestMessage(url);
25
26 // Extract image
27 final ResponseMessage response = document.getContext().getNetwork().send(request);
28
29 // Check whether a response is successful
30 if (response.isSuccess()) {
31 String[] split = url.getPathname().split("/");
32 String path = split[split.length - 1];
33
34 // Save file to a local file system
35 FileHelper.writeAllBytes($o(path), response.getContent().readAsByteArray());
36 }
37}Mit dieser einfachen und effektiven Lösung können Sie den Bildextraktionsprozess automatisieren und so wertvolle Zeit sparen.
Hinweis: Beachten Sie stets die Urheberrechtsgesetze und vergewissern Sie sich, dass Sie über die erforderlichen Genehmigungen oder Lizenzen verfügen, bevor Sie gespeicherte Bilder für kommerzielle Zwecke verwenden. Wir unterstützen nicht die Extraktion und Verwendung von Inhalten aus Drittquellen zu kommerziellen Zwecken ohne entsprechende Genehmigung.
Icons in HTML-Dokumenten werden typischerweise durch <link>-Elemente mit dem Attribut rel="icon" definiert. Um Icons aus einer Website mit Aspose.HTML for Java zu extrahieren, folgen Sie diesen Schritten:
<link> Elemente aus dem Dokument zu sammeln.rel auf "icon" gesetzt ist, da diese Icon-Links definieren.<link> Element.getBaseURI() von HTMLDocument.document.getContext().getNetwork().send().FileHelper.writeAllBytes(). Als Ergebnis werden alle Website-Symbole, auf die in der HTML-Seite verwiesen wird, heruntergeladen und in Ihrem lokalen Dateisystem gespeichert. 1// Download icons from website using Java
2
3// Open a document you want to download icons from
4final HTMLDocument document = new HTMLDocument("https://docs.aspose.com/html/net/message-handlers/");
5
6// Collect all <link> elements
7HTMLCollection links = document.getElementsByTagName("link");
8
9// Leave only "icon" elements
10java.util.Set<Element> icons = new HashSet<>();
11for (Element link : links) {
12 if ("icon".equals(link.getAttribute("rel"))) {
13 icons.add(link);
14 }
15}
16
17// Create a distinct collection of relative icon URLs
18java.util.Set<String> urls = new HashSet<>();
19for (Element icon : icons) {
20 urls.add(icon.getAttribute("href"));
21}
22
23// Create absolute image URLs
24java.util.List<Url> absUrls = urls.stream()
25 .map(src -> new Url(src, document.getBaseURI()))
26 .collect(Collectors.toList());
27
28// foreach to while statements conversion
29for (Url url : absUrls) {
30 // Create a downloading request
31 final RequestMessage request = new RequestMessage(url);
32
33 // Extract icon
34 final ResponseMessage response = document.getContext().getNetwork().send(request);
35
36 // Check whether a response is successful
37 if (response.isSuccess()) {
38 String[] split = url.getPathname().split("/");
39 String path = split[split.length - 1];
40
41 // Save file to a local file system
42 FileHelper.writeAllBytes($o(path), response.getContent().readAsByteArray());
43 }
44}Sie können diese Java-Beispiele verwenden, um die Extraktion aller Bilder aus einer Website zu automatisieren, was für Aufgaben wie Archivierung, Recherche, Analyse von Webinhalten oder andere Anwendungen für den persönlichen Gebrauch hilfreich sein kann. Auch für Webdesigner und -entwickler, die Bilder von Websites extrahieren möchten, ohne in den Quellcode eintauchen zu müssen, ist dies eine tolle Sache.
Aspose.HTML bietet eine Reihe kostenloser Online- HTML-Webanwendungen, darunter Konverter, Zusammenführungen, SEO-Tools, HTML-Code-Generatoren, URL-Utilities und mehr. Diese browserbasierten Tools funktionieren auf allen Betriebssystemen und erfordern keine zusätzliche Softwareinstallation. Ganz gleich, ob Sie Dateien konvertieren oder zusammenführen, Webdaten extrahieren, HTML-Code generieren oder Seiten für die Suchmaschinenoptimierung analysieren müssen, Sie können alles direkt im Web erledigen. Rationalisieren Sie Ihre täglichen Aufgaben und steigern Sie Ihre Produktivität mit unseren benutzerfreundlichen HTML Web Apps – jederzeit und überall.
Analyzing your prompt, please hold on...
An error occurred while retrieving the results. Please refresh the page and try again.