ICode9

精准搜索请尝试: 精确搜索
首页 > 编程语言> 文章详细

c# 抓取 js动态生成的HTML的工具:NHtmlUnit‎

2021-07-23 02:02:07  阅读:246  来源: 互联网

标签:HtmlUnit c# dll NHtmlUnit client nuget HTML js Options


(此博客文章纯属个人记录,转载请注明出处!)

官方地址:NHtmlUnit

编译获取dll方法:

1.下载nuget.exe (nuget所在网站:http://www.nuget.org/)

2.打开DOS命令对话框,

 进入nuget.exe文件所在目录(我的exe文件放在桌面)

 

3.运行命令安装NHtmlUnit,安装后会在当前目录创建两个文件夹,一个是安装所需环境IKVM,另一个就是需要的NHtmlUnit文件夹,里面的lib目录下面有生成的dll

运行命令:nuget install NHtmlUnit

 

3.使用方法可以去HtmlUnit的官方网站阅读文档,或在博客园搜索教程,与JAVA的HtmlUnit的用法是一样的,NHtmlUnit只是

在HtmlUnit上加了个壳使.net可以调用JAVA而已。

 

实例代码(引用dll:HtmlUnit,NHtmlUnit,为了偷懒,我把所有IKVM的dll都引用了):

复制代码
class Program
    {
        static void Main(string[] args)
        {
            WebClient client = new WebClient();
            client.Options.JavaScriptEnabled = false;
            client.Options.CssEnabled = true;
            client.Options.ThrowExceptionOnScriptError = false;
            client.Options.Timeout = 5000;
            HtmlPage page = client.GetHtmlPage("http://www.baidu.com/#wd=11&rsv_spt=1&issp=1&rsv_bp=0&ie=utf-8&tn=baiduhome_pg&rsv_sug3=2&rsv_sug2=0&inputT=26");
            Thread.Sleep(3000);
            string xml = page.AsXml();
            HtmlDocument doc = new HtmlDocument();//忽略此类,这个类是其他DLL提供的,与NHtmlUnit无关
            doc.LoadHtml(xml);
            string nodeName = doc.GetElementbyId("container").Name;
            Console.WriteLine("\r\n\r\n\r\n\r\n" + nodeName + "\r\n\r\n\r\n\r\n" );
            Console.Read();
        }
    }
复制代码

 

 

标签:HtmlUnit,c#,dll,NHtmlUnit,client,nuget,HTML,js,Options
来源: https://www.cnblogs.com/cuihongyu3503319/p/15047157.html

本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享;
2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关;
3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关;
4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除;
5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。

专注分享技术,共同学习,共同进步。侵权联系[81616952@qq.com]

Copyright (C)ICode9.com, All Rights Reserved.

ICode9版权所有