ICode9

精准搜索请尝试: 精确搜索
  • java – 使用JSoup进行屏幕刮擦2019-08-31 08:03:18

    我想通过网络抓取从这个网站获取数据. http://myservices.ect.nl/tracing/objectstatus/Pages/Overview.aspx: 我以前使用JSoup来获取更多静态HTML网站,但是这个更难以实现,因为在我获得网站上的HTML表之前必须单击一个按钮,我不知道是否可以使用JSoup来操作按钮. 单击此按钮后,我得

  • java – JSoup-按标签获取标签之间的文本2019-08-29 06:12:13

    场景:我使用Apache Tika从DOCX文件中获取XHTML.我需要解析此XHTML以获取特定标记之间的文本(例如div或p标记).为此,我使用Jsoup在标签之间获取文本. 问题:最初XHTML有这样的文字: some text [tab-space][tab-space] other text. 但是对于Jsoup,我得到了这个: some text other text.

  • java – 在循环中调用Thread.sleep – 在这种情况下如何防止它(通过重构)?2019-08-28 23:11:02

    我在NetBeans中面临以下警告: 我知道这是人们面临的常见问题,在发布之前我会阅读一些相关问题.但在这个特定的情况下 – 我正在做exponential backoff使用Jsoup下载文档 – 我不知道如何防止警告. 我想到了一个增加时间的计时器,但……它是最优雅的方式吗? Document downloadPageAs

  • java – JSoup – 格式化元素2019-08-28 23:10:43

    假设我有这个HTML: <html> <head> </head> <body> <form method="post"> <select name="books"> <option value="111">111</option>

  • java – 解析字符串并收集具有不同id的HTML元素2019-08-27 02:04:08

    我已将HTML内容传递给字符串“Html_content”.我需要解析字符串“Html_content”并使用ID来选择几个DIV标签,例如“fullHeader”是DIV的id,我需要选择“fullHeader”div标签内的内容并将其存储为字符串. 我尝试了JSOUP,但是我需要在Document中保存收集的div标签,但是我需要将它保存

  • java – 如何使用Jsoup登录页面2019-08-25 14:09:48

    经过几个小时的搜索后,我仍然有点难过在登录后如何访问html页面.看看这里的各种其他帖子以及Jsoup API,我理解访问后的页面登录页面将需要一些这样的代码: Connection.Response loginForm = Jsoup.connect("https://parentviewer.pisd.edu/") .method(Connection.M

  • java – 提取HTML标记之外的文本2019-08-25 12:27:15

    我有以下HTML代码: <div class=example>Text #1</div> "Another Text 1" <div class=example>Text #2</div> "Another Text 2" 我想提取标签外的文本,“另一个文本1”和“另一个文本2” 我正在使用JSoup来实现这一目标. 有任何想法吗??? 谢谢!解决方法:您可以选择每个div-tag的下一个N

  • java – JSOUP检查元素是否为img2019-08-25 05:02:44

    我有一个对象元素xxx. 现在我想迭代它,我想检查是否有任何元素是img标记.我怎样才能做到这一点 ?解决方法:您可以使用tagName: Elements yourElements = ... for( Element element : yourElements ) { if( element.tagName().equals("img") == true) { // It's an

  • java – 使用Jsoup登录网站并留在网站上2019-08-24 08:10:44

    我尝试登录:http://www.gszi.sulinet.hu/dinaweb/diakok/belepes.jsp 有了这个: Connection.Response loginForm = Jsoup.connect("http://www.gszi.sulinet.hu/dinaweb/diakok/belepes.jsp") .method(Connection.Method.GET) .execute(); Docume

  • java – Jsoup在Google Maps API上返回错误4002019-07-29 07:12:18

    我正在开展一个项目,要求我在谷歌地图上找到一些商店的坐标.我已经有了每个商店的地址. 我在Google Geocoding APIs上玩了一点,我认为它们是我需要的:我所需要做的就是连接到DBMS,检索item_id和地址,生成地理编码API的有效URL并处理它将获得的JSON数据. 我不明白为什么,但我生成的UR

  • android – 用jsoup获取img src2019-07-28 12:27:22

    这是我的HTML <script src="/ClientScripts/swfobject.js" language="javascript" type="text/javascript"> </script> <div class="contentDetails"> <div id="ctl00_MainContentPlaceHolder_ContentDetails

  • java爬取读者文摘杂志2019-07-27 22:02:37

    java爬虫入门实战练习 此代码仅用于学习研究 此次练习选择了读者文摘杂志网站进行文章爬取 练习中用到的都只是一些简单的方法,不过过程中复习了输入流输出流的使用以及文件的创建写入等知识,对自己还是有所帮助的 1 import java.io.File; 2 import java.io.FileOutputStream; 3 4

  • java – 防止Jsoup.parse删除结束标记2019-07-27 11:02:43

    我正在使用Jsoup.parse解析一段html. 其他一切都很棒,但我应该稍后在pdf转换器中解析这个HTML. 由于某种原因,Jsoup.parse删除了结束标记,而pdf-parser抛出了关于缺少关闭img标记的异常. Can't load the XML resource (using TRaX transformer). org.xml.sax.SAXParseException;

  • 如何使用Jsoup从html元素中删除所有内联样式和其他属性?2019-07-25 11:01:06

    如何使用Jsoup从html元素中删除所有内联样式和其他属性(class,onclick)? 样本输入: <div style="padding-top:25px;" onclick="javascript:alert('hi');"> This is a sample div <span class='sampleclass'> This is a sample span </span>

  • 使用Jsoup从网页获取没有标签的文本2019-07-24 19:02:41

    我必须使用Jsoup从网页中提取一些数据. 我很容易提取标签中包含的数据,但我仍然需要一些未标记的数据. 这是HTML源代码的示例: <a id="aId" href="aLink" style="aStyle"> <span id="spanId1"> <b>Caldan Therapeutics</b> Announces Key

  • 在Android中操作Web上的数据2019-07-23 19:27:37

    我是一个新的Android程序员,我的问题是: 我想从HTML文件中获取一些信息.下载它并以舒适的方式解析它的最佳方法是什么? 谢谢!解决方法:您可以使用jsoup来解析HTML. Here你可以找到jsoup库和完整的源代码. 这是一个例子:http://desicoding.blogspot.com/2011/03/how-to-parse-html-in-ja

  • java – 在jsoup中的td标记内提取href值2019-07-23 10:12:29

    我有 <table class="table" > <tr> <td><a href="url">text1</a></td> <td>text2</td> </tr> <tr> <td><a href="url2">text</a></td>

  • java – 使用jsoup编码Html字符2019-07-16 19:59:51

    我必须将字符编码为Html: < to < > to > ' to &#39; " to " & to &amp; 我在PHP中寻找像htmlspecialchars这样的实用函数: String htmlspecialchars(String inputText) 是否可以使用JSoup对这些字符进行编码? (我在Spring框架中找到了htmlEscape,但我不想仅仅为这个简单的函数使用

  • java – 用于检查span类是否存在的jSoup2019-07-11 22:00:37

    我有一个HTML格式如下 <article class="cik" id="100"> <a class="ci" href="/abc/1001/STUFF"> <img alt="Micky Mouse" src="/images/1001.jpg" /> <span class=&q

  • java – 如何使用JSoup获取隐藏的输入值?2019-07-11 13:01:40

    我有数据 <input name="authenticity_token" type="hidden" value="aiUlw1Yh4W47lPQearSEdTkU0rhKpziZOweq5PMTV0Q=" /> 我试图用Jsoup选择它. Element input = doc.select("input[name=authenticity_token]").first(); String auth

  • java – 用jsoup解析表2019-07-11 08:00:59

    我正在尝试使用jsoup从linkedin配置文件中提取电子邮件地址和电话号码,每个信息都在一个表中.我编写了一个代码来提取它们但它不起作用,代码应该适用于任何linkedin配置文件.任何帮助或指导将不胜感激. public static void main(String[] args) { try { String url =

  • Jsoup与JavaScript依赖的网页?2019-07-11 01:03:45

    所以我在制定从网页中选择这个元素的正确语法时遇到了麻烦.这是Firefox上的Inspect Element Interface上的路径 以下是我当前的代码: Element prices = doc.select("body[class =en page-type-search page-type-group-shelf og ress] " + "div#wrap " +

  • java – HTML格式化文本2019-07-09 20:27:20

    是否有任何类似于Html.fromHtml()的Java API在Android中执行? JSoup确实解析并删除了标签,但输出不是格式化的. 例如: <ol type="1"> <li>Test1</li> <ol type="a"> <li>TestA1</li> <li>TestB1</li> </ol> <li>Test

  • java – 用Jsoup解析网页.为什么Android上的行为有所不同?2019-07-09 02:03:05

    Document doc = Jsoup.connect(url).get(); 如果我在Android中运行此代码,我会得到一个包含535行(长度:42599)的HTML代码. 如果我在一个示例桌面应用程序中运行此代码,请获取一个包含2050行的html代码(长度:292782,即CORRECT.当然,相同的JSoup库. 谁能解释我为什么?解决方法:设置桌

  • 如何使用jsoup获取网址的“完整”下载大小2019-07-08 21:03:02

    嘿伙计们希望你能帮助我. 我正在使用jsoup来抓取一些网站,但我需要获得下载的总字节数,似乎无法弄明白. 即我需要获取从’get’请求下载的总字节数,包括标题,正文等. 提前致谢.解决方法:也许看看API会有所帮助: Connection.Response response = ... int size = response.bodyAsByte

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有