HtmlAgility:没有内容出现(C#,UWP)

时间:2016-06-18 12:18:32

标签: c# html win-universal-app uwp html-agility-pack

我试图使用htmlagilitypack解析表,在我完成后我意识到我忘了证明htmlagility部分是否有效。 ... 它很明显它不起作用 我也不知道我错过了什么,我在哪里完全错了... 因为我是初学者...... 所以对我来说不要太难。

public partial class WebForm1 : System.Net.Http.HttpClient
{
    protected void Page_Load(object sender, EventArgs e)
    {

        System.Net.Http.HttpClient httpClient = new System.Net.Http.HttpClient();

        string header = "ie";
        if (!headers.UserAgent.TryParseAdd(header))
        {
            throw new Exception("Invalid header value: " + header);
        }

        header = "Mozilla/5.0 (compatible; MSIE 10.0; Windows NT 6.2; WOW64; Trident/6.0)";
        if (!headers.UserAgent.TryParseAdd(header))
        {
            throw new Exception("Invalid header value: " + header);
        }

        HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();


        htmlDoc.LoadHtml(" http://www.eurogymnasium-waldenburg.de/egw_content/Stunden_Vertretungsplan/home.html");



        HtmlNode docNodes = htmlDoc.DocumentNode;

        HtmlNode navNode = htmlDoc.GetElementbyId("bereichaktionen");

        HtmlNode docNode = htmlDoc.DocumentNode.SelectSingleNode("/html/body[@class='ui-widget']/div[@id='main']/div[@id='vplan']/div[@id='bereichaktionen']");

        string nodeValue;

        nodeValue = (docNode.InnerText);

        Debug.WriteLine("nodeValue");

//我怀疑上面有些错误,但我不确定是不是错了。

        if (htmlDoc.ParseErrors != null && htmlDoc.ParseErrors.Count() > 0)
        {

        }
        else
        {

            if (htmlDoc.DocumentNode != null)
            {
                HtmlAgilityPack.HtmlNode bodyNode = htmlDoc.DocumentNode.SelectSingleNode("//body");

                if (bodyNode != null)
                {

                }
            }
        }
    }

原始网址在那里,你们可以尝试一下

谢谢你们 X.L

2 个答案:

答案 0 :(得分:4)

首先,通用应用不支持您当前使用的第三方软件包Html Agility Pack。请使用通用应用程序支持的HtmlAgilityPack for .NET Core 1.4.9.2

其次,方法htmlDoc.LoadHtml(string html)的参数不是HTML网站的Uri,而是可以从webrequest的响应中获取的html内容。

所以正确的代码应如下:

WebRequest request = HttpWebRequest.Create("http://www.eurogymnasium-waldenburg.de/egw_content/Stunden_Vertretungsplan/home.html");
WebResponse response = await request.GetResponseAsync();
Stream stream = response.GetResponseStream();
var result = "";
using (StreamReader sr = new StreamReader(stream))
{
    result = sr.ReadToEnd();
}
HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(result);
var node = htmlDoc.DocumentNode.SelectSingleNode("/html/body[@class='ui-widget']/div[@id='main']/div[@id='vplan']/div[@id='bereichaktionen']");

我还将完整的项目CHtmlAgility上传到你可以下载进行测试的github。

答案 1 :(得分:0)

UWP的HtmlAgilityPack(也是WinRT和其他类似的技术)并不支持XPath。回答HtmlAgilityPack自己OpenGL method

背后的男人
  

Html Agility Pack依赖.NET来实现XPATH。不幸的是,WinRT并不支持XPATH,所以你在WinRT的Html Agility Pack中没有任何与XPATH相关的内容。