jsoup

java – Jsoup,在执行表单POST之前获取值2019-07-08 17:02:15

这是我用来提交表单的代码： Connection.Response res = Jsoup.connect("http://example.com") .data("id", "myID") .data("username", "myUsername") .data("code", "MyAuthcode") // get the value
java – 使用jsoup从带有可变页面数据的“form”类中提取文本2019-07-06 12:34:18

首先发布在这里,所以我会尽力保持这一点.我一直在使用Jsoup从一系列网页中提取数据以引入一个优秀的应用程序.我遇到了一个页面,它根据下拉框中的用户选择动态更新数据.当我在Chrome中检查html时,我可以看到数据,但我似乎无法提取它.我可以提取它周围的所有文本元素,但动态生成的任
autojs脚本引擎调用java的jsoup爬取科学网博客的指定id的好友名字2019-07-05 12:39:25

jsoup 是一款Java 的HTML解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。说明本文提供的代码仅供参考。可能有些地方在最新版本的Auto.js上面需要做修改，才能运行。 Auto.js简介 Auto.js
java – 解析jsoup中元素内的元素？2019-07-04 13:50:32

最近开始编程Android Java(Eclipse),我试图用jsoup制作一个简单的阅读器应用程序. 我有像这样的HTML; <article id="id" class="artikel"> <h1>Title</h1> <p>paragraph 1</p> <p>paragraph 2</p> <p>paragraph 3</p> </arti
android – Jsoup无法读取xml返回文件2019-07-04 02:12:32

我正面临着Jsoup的一些问题.我正在尝试使用我的测试版Android应用中的API从Open Movie Database中检索xml文件. 他们的API文档说如果返回类型是一个xml,只需输入“r =”和返回文件类型.我已经测试了一些请求.其中一个： Jsoup.connect(http://www.omdbapi.com/?i=tt1285016&r=xml).g
java – 使用pdfbox从PDF文件中提取文本2019-07-04 00:50:43

我试图使用pdfbox从PDF文件中提取文本,但不是作为命令行工具,而是在我的Java应用程序中.我正在使用jsoup下载pdf. res = Jsoup .connect(host+action) .ignoreContentType(true) .data(data) .cookies(cookies) .method(Method.POST) .timeout(20*1000) .execute(); // prepare d
android – RoboSpice和Jsoup2019-07-03 14:16:52

我有一个应用程序,我使用Jsoup从互联网上获取HTML文件并将其解析为POJO.然后我使用自定义内容提供程序将我的POJO保存到SQLite数据库中.这是很多代码,某些事情很难实现,特别是缓存(即如何确定我的对象已经存在于数据库中,如何管理过期等).通过浏览互联网,我了解RoboSpice可能会拯救
java – 给出html文件提取只是有意义的文本2019-07-02 22:59:26

给定一个包含css链接,图像链接等的标准html文件,如何才能提取有意义的文本？有意义的是指与页面相关的文本.所以在StackOverflow的情况下,问答文本.对于新闻网站来说,这将是故事的主体. 一种算法可能用于确定什么是句子：搜索在开头和结尾处包含大写字母的单词序列(粗略但只是开始的东
javascript – 将PegDown JSoup输出与PageDown输出匹配2019-07-02 09:47:08

我试图在客户端和服务器端解析并清理markdown. >在客户端,我使用PageDown作为降价编辑器.这正是StackOverflow使用的,它带有一个漂亮的预览框.此预览框显示已清理的html,因此它会删除像< div>这样的内容.标签. >在服务器端,我使用PegDown和JSoup来解析和清理降价. 但是,我发现两者
如何使用Jsoup解析span类中的“text”2019-07-01 22:14:55

我想用Jsoup解析span类中的文本. 这是我的Html代码部分. <html> <head></head> <body> <div> <div class = "abcd"> <span> This is text </span> </div> <div> </body> </html> 我写了类似的东西 Element eleme
java – 通过JSOUP从div类中获取数据2019-07-01 13:49:09

我需要从“rnicper”获得值“8.32”,从“rnstr”获得“36 mg”,从“nirat”获得“20/80 PG / VG”. <div class="recline highlight" id="rnic"> <div class="rlab"><span class="nopr indic indic-danger"></span>Nicotin
java – 可以删除不需要的标签的文本节点2019-06-28 06:46:57

我测试了Jsoup,我无法删除不需要的标签的文本节点. 如果我错了方法,请发信息.方法是： String pretty = Jsoup.clean("<img src=\"marco\">Capretta</img><i>Sono misterioso</i><p color=\"white\"><font size=\"5\">Ciao</p
Android：如何使用jsoup刮取图像(在url中)？ (图像标签包含属性“data-original”,这是图像的url)2019-06-25 09:23:33

我尝试使用JSoup来获取此URL“http://binscorner.com/pages/t/timesofindiacartoons.html”的内容,其中包含卡通图像,但在图像标签中有图像的URL. 我需要刮掉所有的卡通形象.我不知道如何获得实际图像.怎么办？ <font size="3" face="Times New Roman"> <br /> <br /> </font> <im
java – 使用Jsoup发布登录数据2019-06-25 09:22:01

我正在尝试登录这个网站：http://deeproute.com 这是我的代码. Connection.Response res = null; Connection homeConnection = null; Document homePage = null; Map<String, String> loginCookies = null; try {
java – 如何生成匹配Jsoup中特定元素的XPath查询？2019-06-23 09:47:52

_嗨,这是我的网页： <html> <head> </head> <body> <div> text div 1</div> <div> <span>text of first span </span> <span>text of second span </span>
java – Jsoup getElementsByAttributeValueMatching2019-06-20 15:47:30

[JSoup讨论页面建议我在这里问我的问题.] 所以,我不是正则表达式专家,但我想知道我从jsoup得到的结果 getElementsByAttributeValueMatching()方法. 如果我有一个html页面,其中包含(以及其他)以下链接： <a href="/tweb/tiles/twr/EIDS_AT_20130108T134335/01/">Parent Directory</a
java – 如何使用JSoup解析HTML文档以获取链接列表？2019-06-14 00:47:49

我试图解析http://www.craigslist.org/about/sites以构建一组文本/链接,以使用此信息动态加载程序.到目前为止,我已经这样做了： Document doc = Jsoup.connect("http://www.craigslist.org/about/sites").get(); Elements elms = doc.select("div.colmask"); // gets 7 countries
使用java代码获取完整的网页2019-06-13 15:23:17

我想实现一个java方法,它将URL作为输入并存储整个网页,包括css,images,js(所有相关资源)在我的磁盘上.我使用Jsoup html解析器来获取html页面.现在我想要实现的唯一选择是使用jsoup获取页面,现在解析html内容并将相对路径转换为绝对路径,然后再生成javascript,图像等的get请求并将
java – 使用JSoup设置HTML标签的属性2019-06-13 03:58:37

如何使用JSoup设置HTML标签的属性？我想使用Jsoup Library在Java中设置tag->“img”的attribute->“src”. Elements img_attributes = doc.select("img[src^=/im]"); for(Element img_attribute: img_attributes) { String s = img_attribute.attr("src"); System.out.pr
java – Jsoup检查字符串是否有效HTML2019-06-12 14:49:09

我在使用Jsoup解析器时遇到了困难.如何判断给定的字符串是否是有效的HTML代码？ String input = "Your vote was successfully added." boolean isValid = Jsoup.isValid(input); // isValid = true isValid标志是真的,因为Jsoup首先使用HtmlTreeBuilder：如果没有html,head或body标
java – 如何使用jsoup获取所有div元素？2019-06-12 07:48:42

我正在学习如何使用jsoup.我首先认为jsoup就像jquery,但事实并非如此. 我想将这个html主体提取为div的元素. <html> <head></head> <body> <div> <h1>Title</h1> </div> <div> &
java – 如何将Jsoup添加到我的Android Studio项目？2019-06-11 07:19:57

我试图在我的android工作室项目中使用jsoup,但我一直收到此错误：错误：(10,16)Gradle：错误：包org.jsoup不存在. 你能告诉我如何将jsoup库添加到我的项目中的步骤吗？提前致谢. 编辑：为了学习purpuse我在没有主要活动的情况下单独运行java代码！码： package com.jsoupTest.jsoupTest; impor
尝试在空对象引用上调用虚方法’java.lang.String org.jsoup.nodes.Element.ownText()’2019-06-11 04:19:12

我使用下面的代码通过使用jsoup从playstore获取versionName我正在获取详细信息,但它抛出了一些异常. 我的代码是 public class ForceUpdateAsync extends AsyncTask<String, String, JSONObject>{ private String latestVersion; private String currentVersion; private Context
java – Jsoup：select()在不应该返回时返回空2019-06-10 04:51:29

我试图在维基百科的Google入门页面上选择信息框：http://en.m.wikipedia.org/wiki/Google 所以,我打电话给： contentDiv = document.select("div[id=content]").first(); 哪个按预期工作,然后我做： Elements infoboxes = contentDiv.select("table[class=infobox]"); 然后我检查了i
调试Java内存不足错误2019-06-10 00:58:36

我仍然是一个相对较新的程序员,我在Java中遇到的一个问题是Out of Memory Errors.我不想使用-Xmx来增加内存,因为我觉得错误是由于编程不好造成的,我想改进编码而不是依靠更多的内存. 我所做的工作涉及处理大量文本文件,每个文本文件在压缩时大约为1GB.我在这里的代码是为了遍历一

首页 < 5 6 7 8 > 尾页

ICode9

java – Jsoup,在执行表单POST之前获取值2019-07-08 17:02:15

java – 使用jsoup从带有可变页面数据的“form”类中提取文本2019-07-06 12:34:18

autojs脚本引擎调用java的jsoup爬取科学网博客的指定id的好友名字2019-07-05 12:39:25

java – 解析jsoup中元素内的元素？2019-07-04 13:50:32

android – Jsoup无法读取xml返回文件2019-07-04 02:12:32

java – 使用pdfbox从PDF文件中提取文本2019-07-04 00:50:43

android – RoboSpice和Jsoup2019-07-03 14:16:52

java – 给出html文件提取只是有意义的文本2019-07-02 22:59:26

javascript – 将PegDown JSoup输出与PageDown输出匹配2019-07-02 09:47:08

如何使用Jsoup解析span类中的“text”2019-07-01 22:14:55

java – 通过JSOUP从div类中获取数据2019-07-01 13:49:09

java – 可以删除不需要的标签的文本节点2019-06-28 06:46:57

Android：如何使用jsoup刮取图像(在url中)？ (图像标签包含属性“data-original”,这是图像的url)2019-06-25 09:23:33

java – 使用Jsoup发布登录数据2019-06-25 09:22:01

java – 如何生成匹配Jsoup中特定元素的XPath查询？2019-06-23 09:47:52

java – Jsoup getElementsByAttributeValueMatching2019-06-20 15:47:30

java – 如何使用JSoup解析HTML文档以获取链接列表？2019-06-14 00:47:49

使用java代码获取完整的网页2019-06-13 15:23:17

java – 使用JSoup设置HTML标签的属性2019-06-13 03:58:37

java – Jsoup检查字符串是否有效HTML2019-06-12 14:49:09

java – 如何使用jsoup获取所有div元素？2019-06-12 07:48:42

java – 如何将Jsoup添加到我的Android Studio项目？2019-06-11 07:19:57

尝试在空对象引用上调用虚方法’java.lang.String org.jsoup.nodes.Element.ownText()’2019-06-11 04:19:12

java – Jsoup：select()在不应该返回时返回空2019-06-10 04:51:29

调试Java内存不足错误2019-06-10 00:58:36