ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

java-如何使用JSOUP或Coldfusion从URL中删除查询字符串和哈希值?

2019-11-19 14:02:23  阅读:256  来源: 互联网

标签:coldfusion jsoup java


这是示例:

当我解析HTML页面时.我收到重复的网址值,例如

> https://stackoverflow.com/questions/tagged/java?sort=featured&pageSize=50
> https://stackoverflow.com/questions/tagged/java#comments
> https://stackoverflow.com/questions/tagged/java#comment212

如何避免出现上述重复值?

我只需要这个URL https://stackoverflow.com/questions/tagged/java

解决方法:

我创建了一个辅助方法processURL(),它接受一个URL并返回一个包含查询标记(?)或井号(#)之前的所有内容的URL:

String processURL(String theURL) {
    int endPos;
    if (theURL.indexOf("?") > 0) {
        endPos = theURL.indexOf("?");
    } else if (theURL.indexOf("#") > 0) {
        endPos = theURL.indexOf("#");
    } else {
        endPos = theURL.length();
    }

    return theURL.substring(0, endPos);
}

String urlOne = "https://stackoverflow.com/questions/tagged/jav?#sort=featured&pageSize=50";
String urlTwo = "https://stackoverflow.com/questions/tagged/java#comments";

System.out.println(processURL(urlOne));
System.out.println(processURL(urlTwo));

输出:

https://stackoverflow.com/questions/tagged/java
https://stackoverflow.com/questions/tagged/java

标签:coldfusion,jsoup,java
来源: https://codeday.me/bug/20191119/2036640.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有