使用C#提取HtmlElement“onclick”属性的文本内容

时间:2013-01-30 22:48:08

标签: c# html-parsing webbrowser-control

我有这个HTML代码

<div class="anc-style" onclick="window.open('./view.php?a=foo')"></div>

我想提取“onclick”属性的内容。我试图做类似的事情:

div.GetAttribute("onclick").ToString();

理想情况下,这将产生字符串

"window.open('./view.php?a=foo')"

但它返回一个System .__ ComObject。

我可以通过改变(“onclick”)到(“class”)来获得课程,onclick会发生什么?

HtmlElementCollection div = webBrowser1.Document.GetElementsByTagName("div");
        for (int j = 0; j < div.Count; j++) {
            if (div[j].GetAttribute("class") == "anc-style") {
             richTextBox1.AppendText(div[j].GetAttribute("onclick").ToString());   
            }
        }

2 个答案:

答案 0 :(得分:4)

您可以使用htmlDocument类提取文档标记并提取下面的数据。这只是一个例子

string htmlText = "<html><head></head><body><div class=\"anc-style\" onclick=\"window.open('./view.php?a=foo')\"></div></body></html>";

WebBrowser wb = new WebBrowser();
wb.DocumentText = "";
wb.Document.Write(htmlText);
foreach (HtmlElement hElement in  wb.Document.GetElementsByTagName("DIV"))
{
    //get start and end positions
    int iStartPos = hElement.OuterHtml.IndexOf("onclick=\"") + ("onclick=\"").Length;
    int iEndPos = hElement.OuterHtml.IndexOf("\">",iStartPos);
    //get our substring
    String s = hElement.OuterHtml.Substring(iStartPos, iEndPos - iStartPos);

    MessageBox.Show(s);
}

答案 1 :(得分:0)

还尝试使用div[j]["onclick"]您使用的是什么浏览器?

我已经创建了一个可以尝试的jsfiddle,看看它是否适合你

http://jsfiddle.net/4ZwNs/102/