ICode9

精准搜索请尝试: 精确搜索
首页 > 其他分享> 文章详细

Jsoup实现获取京东商城图片

2021-07-21 15:03:35  阅读:224  来源: 互联网

标签:attr img URL 标签 获取 Jsoup println 京东 商城


Jsoup是第三方类库,方便操作获取页面内容

Jsoup的maven仓库坐标:
<dependency>
    <groupId>org.jsoup</groupId>
    <artifactId>jsoup</artifactId>
    <version>1.13.1</version>
</dependency>
流程:

解析网页URL,获取页面document,通过F12查看页面元素标签,获取图片所在的父标签,根据父标签来获取img标签对象。然后获取图片路径URL,建立URL连接,获取输入流,创建输出流写入本地文件。

主要代码
public class Main {
    public static void main(String[] args) throws Exception {
        //网址路径
        //由于URL中使用中文会报错,所以这里需要将中文转码:URLEncoder.encode("联想笔记本","UTF-8")
        String path = "https://search.jd.com/Search?keyword="+ URLEncoder.encode("联想笔记本","UTF-8")+ "&enc=utf-8&spm=2.1.0";
        //创建URL对象
        URL url = new URL(path);
        //解析url返回页面的Document对象,
        Document document = Jsoup.parse(url, 10000);

        //要按F12查看元素标签内容
        //获取图片所在的父标签
        Element J_goodsList = document.getElementById("J_goodsList");

        //根据父标签来获取img标签对象
        Elements imgs = J_goodsList.getElementsByTag("img");
        System.out.println("------------------------------------------------------");
        System.out.println("获取的img标签内容如下\n"+imgs);
        System.out.println("------------------------------------------------------");

        URL imgURL;
        int num = 0;
        for(Element img : imgs){
            //根据属性来获取图片路径地址
            String attr = img.attr("data-lazy-img");
            if(!attr.isEmpty()){
                num ++;
                attr = "https:"+attr;
                System.out.println("该图片路径如下:"+attr);
                //下载图片到本地
                imgURL = new URL(attr);
                //连接到URL
                URLConnection urlConnection = imgURL.openConnection();
                //获取输入流
                InputStream reader = urlConnection.getInputStream();
                OutputStream writer = new FileOutputStream("src/main/resources/imgs/" + num + ".jpg");
                int temp;
                //写入到本地文件
                while((temp = reader.read()) != -1){
                    writer.write(temp);
                    writer.flush();
                }
                System.out.println(num+".jpg下载完毕!");
                reader.close();
            }
        }
    }
}

标签:attr,img,URL,标签,获取,Jsoup,println,京东,商城
来源: https://blog.csdn.net/qq_48176561/article/details/118966274

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有