HTMLAGILITYPACK将整个HTML源保存为字符串

时间:2018-05-31 18:46:15

标签: c# web html-agility-pack

所以基本上这就是我想要做的,我想将整个html源文本保存到一个字符串中,我将检查它是否包含myvar。 我已经看到许多其他主题说如何做到这一点,但我尝试了它们并最终出现错误,当我使用.load(“example.com”)时,我要么进入休息状态;或者字符串最终将包含URL而不是实际的HTML代码。

这是我的代码:

        string myString = "Pastebin";


        HtmlAgilityPack.HtmlDocument page = new HtmlAgilityPack.HtmlDocument();
        page.Load("https://pastebin.com");
        string text = page.DocumentNode.OuterHtml;


        if (text.Contains(myString))
        {
             MessageBox.Show("Yay!\n Match!");
            Instance = this;
            InitializeComponent();
            timer1.Start();
        }
        else
        {
            MessageBox.Show("Error...\nThe Var Doesnt match");
            Application.Exit();
        }
    }

结果:

使用.load(“example.com”);应用程序进入中断状态。 使用.loadhtml(“example.com”);应用程序存储URL而不是HTML

1 个答案:

答案 0 :(得分:0)

这是documentation。使用HtmlWeb按网址加载html页面:

using HtmlAgilityPack;
//...

    HtmlWeb htmlWeb = new HtmlWeb();
    HtmlDocument htmlDoc = htmlWeb.Load("https://pastebin.com");
    string text = htmlDoc.Text;