jsoup

java – 使用JSoup进行屏幕刮擦2019-08-31 08:03:18

我想通过网络抓取从这个网站获取数据. http://myservices.ect.nl/tracing/objectstatus/Pages/Overview.aspx：我以前使用JSoup来获取更多静态HTML网站,但是这个更难以实现,因为在我获得网站上的HTML表之前必须单击一个按钮,我不知道是否可以使用JSoup来操作按钮. 单击此按钮后,我得
java – JSoup-按标签获取标签之间的文本2019-08-29 06:12:13

场景：我使用Apache Tika从DOCX文件中获取XHTML.我需要解析此XHTML以获取特定标记之间的文本(例如div或p标记).为此,我使用Jsoup在标签之间获取文本. 问题：最初XHTML有这样的文字： some text [tab-space][tab-space] other text. 但是对于Jsoup,我得到了这个： some text other text.
java – 在循环中调用Thread.sleep – 在这种情况下如何防止它(通过重构)？2019-08-28 23:11:02

我在NetBeans中面临以下警告：我知道这是人们面临的常见问题,在发布之前我会阅读一些相关问题.但在这个特定的情况下 – 我正在做exponential backoff使用Jsoup下载文档 – 我不知道如何防止警告. 我想到了一个增加时间的计时器,但……它是最优雅的方式吗？ Document downloadPageAs
java – JSoup – 格式化元素2019-08-28 23:10:43

假设我有这个HTML： <html> <head> </head> <body> <form method="post"> <select name="books"> <option value="111">111</option>
java – 解析字符串并收集具有不同id的HTML元素2019-08-27 02:04:08

我已将HTML内容传递给字符串“Html_content”.我需要解析字符串“Html_content”并使用ID来选择几个DIV标签,例如“fullHeader”是DIV的id,我需要选择“fullHeader”div标签内的内容并将其存储为字符串. 我尝试了JSOUP,但是我需要在Document中保存收集的div标签,但是我需要将它保存
java – 如何使用Jsoup登录页面2019-08-25 14:09:48

经过几个小时的搜索后,我仍然有点难过在登录后如何访问html页面.看看这里的各种其他帖子以及Jsoup API,我理解访问后的页面登录页面将需要一些这样的代码： Connection.Response loginForm = Jsoup.connect("https://parentviewer.pisd.edu/") .method(Connection.M
java – 提取HTML标记之外的文本2019-08-25 12:27:15

我有以下HTML代码： <div class=example>Text #1</div> "Another Text 1" <div class=example>Text #2</div> "Another Text 2" 我想提取标签外的文本,“另一个文本1”和“另一个文本2” 我正在使用JSoup来实现这一目标. 有任何想法吗？？？谢谢！解决方法:您可以选择每个div-tag的下一个N
java – JSOUP检查元素是否为img2019-08-25 05:02:44

我有一个对象元素xxx. 现在我想迭代它,我想检查是否有任何元素是img标记.我怎样才能做到这一点？解决方法:您可以使用tagName： Elements yourElements = ... for( Element element : yourElements ) { if( element.tagName().equals("img") == true) { // It's an
java – 使用Jsoup登录网站并留在网站上2019-08-24 08:10:44

我尝试登录：http://www.gszi.sulinet.hu/dinaweb/diakok/belepes.jsp 有了这个： Connection.Response loginForm = Jsoup.connect("http://www.gszi.sulinet.hu/dinaweb/diakok/belepes.jsp") .method(Connection.Method.GET) .execute(); Docume
java – Jsoup在Google Maps API上返回错误4002019-07-29 07:12:18

我正在开展一个项目,要求我在谷歌地图上找到一些商店的坐标.我已经有了每个商店的地址. 我在Google Geocoding APIs上玩了一点,我认为它们是我需要的：我所需要做的就是连接到DBMS,检索item_id和地址,生成地理编码API的有效URL并处理它将获得的JSON数据. 我不明白为什么,但我生成的UR
android – 用jsoup获取img src2019-07-28 12:27:22

这是我的HTML <script src="/ClientScripts/swfobject.js" language="javascript" type="text/javascript"> </script> <div class="contentDetails"> <div id="ctl00_MainContentPlaceHolder_ContentDetails
java爬取读者文摘杂志2019-07-27 22:02:37

java爬虫入门实战练习此代码仅用于学习研究此次练习选择了读者文摘杂志网站进行文章爬取练习中用到的都只是一些简单的方法，不过过程中复习了输入流输出流的使用以及文件的创建写入等知识，对自己还是有所帮助的 1 import java.io.File; 2 import java.io.FileOutputStream; 3 4
java – 防止Jsoup.parse删除结束标记2019-07-27 11:02:43

我正在使用Jsoup.parse解析一段html. 其他一切都很棒,但我应该稍后在pdf转换器中解析这个HTML. 由于某种原因,Jsoup.parse删除了结束标记,而pdf-parser抛出了关于缺少关闭img标记的异常. Can't load the XML resource (using TRaX transformer). org.xml.sax.SAXParseException;
如何使用Jsoup从html元素中删除所有内联样式和其他属性？2019-07-25 11:01:06

如何使用Jsoup从html元素中删除所有内联样式和其他属性(class,onclick)？样本输入： <div style="padding-top:25px;" onclick="javascript:alert('hi');"> This is a sample div <span class='sampleclass'> This is a sample span </span>
使用Jsoup从网页获取没有标签的文本2019-07-24 19:02:41

我必须使用Jsoup从网页中提取一些数据. 我很容易提取标签中包含的数据,但我仍然需要一些未标记的数据. 这是HTML源代码的示例： <a id="aId" href="aLink" style="aStyle"> <span id="spanId1"> <b>Caldan Therapeutics</b> Announces Key
在Android中操作Web上的数据2019-07-23 19:27:37

我是一个新的Android程序员,我的问题是：我想从HTML文件中获取一些信息.下载它并以舒适的方式解析它的最佳方法是什么？谢谢！解决方法:您可以使用jsoup来解析HTML. Here你可以找到jsoup库和完整的源代码. 这是一个例子：http://desicoding.blogspot.com/2011/03/how-to-parse-html-in-ja
java – 在jsoup中的td标记内提取href值2019-07-23 10:12:29

我有 <table class="table" > <tr> <td><a href="url">text1</a></td> <td>text2</td> </tr> <tr> <td><a href="url2">text</a></td>
java – 使用jsoup编码Html字符2019-07-16 19:59:51

我必须将字符编码为Html： < to < > to > ' to ' " to " & to & 我在PHP中寻找像htmlspecialchars这样的实用函数： String htmlspecialchars(String inputText) 是否可以使用JSoup对这些字符进行编码？ (我在Spring框架中找到了htmlEscape,但我不想仅仅为这个简单的函数使用
java – 用于检查span类是否存在的jSoup2019-07-11 22:00:37

我有一个HTML格式如下 <article class="cik" id="100"> <a class="ci" href="/abc/1001/STUFF"> <img alt="Micky Mouse" src="/images/1001.jpg" /> <span class=&q
java – 如何使用JSoup获取隐藏的输入值？2019-07-11 13:01:40

我有数据 <input name="authenticity_token" type="hidden" value="aiUlw1Yh4W47lPQearSEdTkU0rhKpziZOweq5PMTV0Q=" /> 我试图用Jsoup选择它. Element input = doc.select("input[name=authenticity_token]").first(); String auth
java – 用jsoup解析表2019-07-11 08:00:59

我正在尝试使用jsoup从linkedin配置文件中提取电子邮件地址和电话号码,每个信息都在一个表中.我编写了一个代码来提取它们但它不起作用,代码应该适用于任何linkedin配置文件.任何帮助或指导将不胜感激. public static void main(String[] args) { try { String url =
Jsoup与JavaScript依赖的网页？2019-07-11 01:03:45

所以我在制定从网页中选择这个元素的正确语法时遇到了麻烦.这是Firefox上的Inspect Element Interface上的路径以下是我当前的代码： Element prices = doc.select("body[class =en page-type-search page-type-group-shelf og ress] " + "div#wrap " +
java – HTML格式化文本2019-07-09 20:27:20

是否有任何类似于Html.fromHtml()的Java API在Android中执行？ JSoup确实解析并删除了标签,但输出不是格式化的. 例如： <ol type="1"> <li>Test1</li> <ol type="a"> <li>TestA1</li> <li>TestB1</li> </ol> <li>Test
java – 用Jsoup解析网页.为什么Android上的行为有所不同？2019-07-09 02:03:05

Document doc = Jsoup.connect(url).get(); 如果我在Android中运行此代码,我会得到一个包含535行(长度：42599)的HTML代码. 如果我在一个示例桌面应用程序中运行此代码,请获取一个包含2050行的html代码(长度：292782,即CORRECT.当然,相同的JSoup库. 谁能解释我为什么？解决方法:设置桌
如何使用jsoup获取网址的“完整”下载大小2019-07-08 21:03:02

嘿伙计们希望你能帮助我. 我正在使用jsoup来抓取一些网站,但我需要获得下载的总字节数,似乎无法弄明白. 即我需要获取从’get’请求下载的总字节数,包括标题,正文等. 提前致谢.解决方法:也许看看API会有所帮助： Connection.Response response = ... int size = response.bodyAsByte

首页 < 4 5 6 7 8 > 尾页

ICode9

java – 使用JSoup进行屏幕刮擦2019-08-31 08:03:18

java – JSoup-按标签获取标签之间的文本2019-08-29 06:12:13

java – 在循环中调用Thread.sleep – 在这种情况下如何防止它(通过重构)？2019-08-28 23:11:02

java – JSoup – 格式化元素2019-08-28 23:10:43

java – 解析字符串并收集具有不同id的HTML元素2019-08-27 02:04:08

java – 如何使用Jsoup登录页面2019-08-25 14:09:48

java – 提取HTML标记之外的文本2019-08-25 12:27:15

java – JSOUP检查元素是否为img2019-08-25 05:02:44

java – 使用Jsoup登录网站并留在网站上2019-08-24 08:10:44

java – Jsoup在Google Maps API上返回错误4002019-07-29 07:12:18

android – 用jsoup获取img src2019-07-28 12:27:22

java爬取读者文摘杂志2019-07-27 22:02:37

java – 防止Jsoup.parse删除结束标记2019-07-27 11:02:43

如何使用Jsoup从html元素中删除所有内联样式和其他属性？2019-07-25 11:01:06

使用Jsoup从网页获取没有标签的文本2019-07-24 19:02:41

在Android中操作Web上的数据2019-07-23 19:27:37

java – 在jsoup中的td标记内提取href值2019-07-23 10:12:29

java – 使用jsoup编码Html字符2019-07-16 19:59:51

java – 用于检查span类是否存在的jSoup2019-07-11 22:00:37

java – 如何使用JSoup获取隐藏的输入值？2019-07-11 13:01:40

java – 用jsoup解析表2019-07-11 08:00:59

Jsoup与JavaScript依赖的网页？2019-07-11 01:03:45

java – HTML格式化文本2019-07-09 20:27:20

java – 用Jsoup解析网页.为什么Android上的行为有所不同？2019-07-09 02:03:05

如何使用jsoup获取网址的“完整”下载大小2019-07-08 21:03:02