Analyzing your prompt, please hold on...
An error occurred while retrieving the results. Please refresh the page and try again.
Si vous êtes développeur web, graphiste, chercheur, journaliste, étudiant ou si vous travaillez simplement sur un projet personnel, vous aurez probablement besoin d’images et de la possibilité de les collecter à partir de sites web. L’enregistrement manuel des images – en copiant chaque URL et en les téléchargeant une par une – peut prendre beaucoup de temps et s’avérer inefficace. Cependant, vous pouvez utiliser la bibliothèque Aspose.HTML for Java library pour automatiser ce processus et extraire des images d’un site web par programme.
Cet article explique comment extraire par programmation différents types d’images d’un site web à l’aide de Java. Avec Aspose.HTML for Java, vous pouvez facilement créer un outil qui analyse une page HTML, identifie les sources d’images et télécharge ces images. Il s’agit d’une solution puissante pour tous ceux qui ont besoin de collecter des images à des fins d’analyse, d’archivage ou de création de contenu, sans avoir à le faire manuellement.
La plupart des images d’un document HTML sont représentées à l’aide de l’élément <img>. L’extrait de code suivant montre comment utiliser Aspose.HTML for Java pour trouver les images spécifiées par cet élément. Ainsi, pour télécharger des images à partir d’un site web, vous devez suivre les étapes suivantes :
HTMLDocument en lui transmettant l’URL de la page web à traiter.<img> du document. La méthode renvoie une collection d’éléments <img> présents sur la page.<img> et utilisez la méthode
getAttribute(“src”) pour obtenir la valeur de l’attribut src de chaque image. Chaque src est ajouté à l’ensemble urls.BaseURI du document pour convertir les chemins d’accès relatifs aux images en URL absolues.document.getContext().getNetwork().send(request). Cela renvoie un MessageRéponse.response.getContent().readAsByteArray() et enregistrez-les sur votre système de fichiers local en utilisant FileHelper.writeAllBytes(). 1// Extract images from website using Java
2
3// Open a document you want to download images from
4final HTMLDocument document = new HTMLDocument("https://docs.aspose.com/svg/net/drawing-basics/svg-shapes/");
5
6// Collect all <img> elements
7HTMLCollection images = document.getElementsByTagName("img");
8
9// Create a distinct collection of relative image URLs
10Iterator<Element> iterator = images.iterator();
11java.util.Set<String> urls = new HashSet<>();
12for (Element e : images) {
13 urls.add(e.getAttribute("src"));
14}
15
16// Create absolute image URLs
17java.util.List<Url> absUrls = urls.stream()
18 .map(src -> new Url(src, document.getBaseURI()))
19 .collect(Collectors.toList());
20
21// foreach to while statements conversion
22for (Url url : absUrls) {
23 // Create an image request message
24 final RequestMessage request = new RequestMessage(url);
25
26 // Extract image
27 final ResponseMessage response = document.getContext().getNetwork().send(request);
28
29 // Check whether a response is successful
30 if (response.isSuccess()) {
31 String[] split = url.getPathname().split("/");
32 String path = split[split.length - 1];
33
34 // Save file to a local file system
35 FileHelper.writeAllBytes($o(path), response.getContent().readAsByteArray());
36 }
37}Cette solution simple et efficace vous permet d’automatiser le processus d’extraction d’images et de gagner un temps précieux.
Note: Respectez toujours les lois sur les droits d’auteur et assurez-vous que vous disposez des autorisations ou licences nécessaires avant d’utiliser les images sauvegardées à des fins commerciales. Nous ne soutenons pas l’extraction et l’utilisation du contenu de sources tierces à des fins commerciales sans autorisation appropriée.
Dans les documents HTML, les icônes sont généralement définies à l’aide d’éléments <link> dotés de l’attribut rel="icon". Pour extraire des icônes d’un site Web à l’aide d’Aspose.HTML for Java, procédez comme suit :
<link> du document.rel est fixé à "icon", car ils définissent des liens en forme d’icônes.<link> filtré.getBaseURI() de HTMLDocument.document.getContext().getNetwork().send().FileHelper.writeAllBytes(). Ainsi, toutes les icônes du site web référencées dans le code HTML seront téléchargées et sauvegardées dans votre système de fichiers local. 1// Download icons from website using Java
2
3// Open a document you want to download icons from
4final HTMLDocument document = new HTMLDocument("https://docs.aspose.com/html/net/message-handlers/");
5
6// Collect all <link> elements
7HTMLCollection links = document.getElementsByTagName("link");
8
9// Leave only "icon" elements
10java.util.Set<Element> icons = new HashSet<>();
11for (Element link : links) {
12 if ("icon".equals(link.getAttribute("rel"))) {
13 icons.add(link);
14 }
15}
16
17// Create a distinct collection of relative icon URLs
18java.util.Set<String> urls = new HashSet<>();
19for (Element icon : icons) {
20 urls.add(icon.getAttribute("href"));
21}
22
23// Create absolute image URLs
24java.util.List<Url> absUrls = urls.stream()
25 .map(src -> new Url(src, document.getBaseURI()))
26 .collect(Collectors.toList());
27
28// foreach to while statements conversion
29for (Url url : absUrls) {
30 // Create a downloading request
31 final RequestMessage request = new RequestMessage(url);
32
33 // Extract icon
34 final ResponseMessage response = document.getContext().getNetwork().send(request);
35
36 // Check whether a response is successful
37 if (response.isSuccess()) {
38 String[] split = url.getPathname().split("/");
39 String path = split[split.length - 1];
40
41 // Save file to a local file system
42 FileHelper.writeAllBytes($o(path), response.getContent().readAsByteArray());
43 }
44}Vous pouvez utiliser ces exemples Java pour automatiser l’extraction de toutes les images d’un site web, ce qui peut être utile pour des tâches telles que l’archivage, la recherche, l’analyse de contenu web ou toute autre application à usage personnel. C’est également très utile pour les concepteurs et les développeurs de sites web qui souhaitent extraire des images de sites sans avoir à plonger dans le code source.
Aspose.HTML propose un ensemble d’ applications Web HTML gratuites en ligne, notamment des convertisseurs, des fusionneurs, des outils de référencement, des générateurs de code HTML, des utilitaires d’URL, et bien d’autres encore. Ces outils basés sur un navigateur fonctionnent sur n’importe quel système d’exploitation et ne nécessitent aucune installation de logiciel supplémentaire. Que vous ayez besoin de convertir ou de fusionner des fichiers, d’extraire des données web, de générer du code HTML ou d’analyser des pages pour le référencement, vous pouvez le faire directement sur le web. Rationalisez vos tâches quotidiennes et augmentez votre productivité grâce à nos HTML Web Apps faciles à utiliser – à tout moment et en tout lieu.
Analyzing your prompt, please hold on...
An error occurred while retrieving the results. Please refresh the page and try again.