从html页面的<div>标签获取文本到c#</div>

时间:2012-01-31 07:04:17

标签: c# windows-phone-7 html

如何将div标签中的文本从网页获取到我的.cs文件(C#)?

我测试了html敏捷包,但它不起作用我得到了不同的错误,这可能是因为这是一个Windows Phone 7项目。有没有人知道如何解决这个问题?

3 个答案:

答案 0 :(得分:0)

Silverlight C#代码

string text = HtmlPage.Window.Invoke("getDivText").ToString();

HTML

function getDivText() {
    return YourDivText;
}

答案 1 :(得分:0)

HtmlAgilityPack应该是您所需要的。确保从NuGet获取,而不是直接从项目页面获取,因为NuGet版本包含WP7版本。

<强>更新

Windows Phone不支持同步网络API,因此HtmlAgilityPack无法支持异步加载。您需要将回调传递给LoadAsync才能使用它。

答案 2 :(得分:0)

如果要从字符串而不是实际文件创建文档,则应使用 -

     doc.LoadHtml(string); 

修改 这就是我如何使用HtmlAgilityPack从网页进行解析。(但这是在winForms中)

      string page;
      using(WebClient client = new WebClient())
      {
          page = client.DownloadString(url);
      }

      HtmlDocument doc = new HtmlDocument();  
      doc.LoadHtml(page);


      string result;
      HtmlNode node = doc.DocumentNode.SelectSingleNode("//span[@class='obf']");
      result = node.InnerText;