正则表达式以获取HTML标签之间的值

时间:2019-05-21 10:58:22

标签: .net

我需要提取html标签之间的值。所以我想我需要使用一些正则表达式。我的输入是:

<th style="text-align: left; padding: 4px 8px; margin-bottom: 0px; border-bottom: 1px dotted #ccc;">Monitoring Parameter</th>

预期输出:Monitoring Parameter

很遗憾,我的模式"<th[^>]*>(.*?)</th>"不起作用。

预先感谢

1 个答案:

答案 0 :(得分:1)

Mathyn's comment中所述,正则表达式和HTML不能很好地结合在一起。

如果要在C#中使用HTML,我建议您使用HTML Agility Pack,它可以解析HTML并使用LINQ进行浏览。开始时可能会有些令人生畏,但比起使用Regex处理HTML的不规则性,您将有更好的时间。