使用C#中的正则表达式获取Div内容

时间:2011-02-04 16:38:05

标签: c# regex text html

我有这个Html代码:

<div id="top" style="something i dont know">
Text
</div>

我只想获得字符串“Text”。 我的脚本看起来像这样:

Regex search_string = new Regex("<div id=\"top\".*?>([^<]+)</div>");
Match match = search_string.Match(code);
string section = match.Groups[0].Value;
MessageBox.Show(section);

这对C#来说是否可行?

2 个答案:

答案 0 :(得分:0)

使用XPath更容易

http://www.codeproject.com/KB/cpp/myXPath.aspx

将其用作xpath选择器

//div[@id='top']

然后你可以获得内在价值

答案 1 :(得分:0)

如前所述,您最好使用XPath。为了能够像使用XML一样使用HTML,您可以使用HTML Agility Pack,这对像您这样的任务非常有用。