标签:coldfusion jsoup java
这是示例:
当我解析HTML页面时.我收到重复的网址值,例如
> https://stackoverflow.com/questions/tagged/java?sort=featured&pageSize=50
> https://stackoverflow.com/questions/tagged/java#comments
> https://stackoverflow.com/questions/tagged/java#comment212
如何避免出现上述重复值?
我只需要这个URL https://stackoverflow.com/questions/tagged/java
解决方法:
我创建了一个辅助方法processURL(),它接受一个URL并返回一个包含查询标记(?)或井号(#)之前的所有内容的URL:
String processURL(String theURL) {
int endPos;
if (theURL.indexOf("?") > 0) {
endPos = theURL.indexOf("?");
} else if (theURL.indexOf("#") > 0) {
endPos = theURL.indexOf("#");
} else {
endPos = theURL.length();
}
return theURL.substring(0, endPos);
}
String urlOne = "https://stackoverflow.com/questions/tagged/jav?#sort=featured&pageSize=50";
String urlTwo = "https://stackoverflow.com/questions/tagged/java#comments";
System.out.println(processURL(urlOne));
System.out.println(processURL(urlTwo));
输出:
https://stackoverflow.com/questions/tagged/java
https://stackoverflow.com/questions/tagged/java
标签:coldfusion,jsoup,java 来源: https://codeday.me/bug/20191119/2036640.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。