我需要提取html标签之间的值。所以我想我需要使用一些正则表达式。我的输入是:
<th style="text-align: left; padding: 4px 8px; margin-bottom: 0px; border-bottom: 1px dotted #ccc;">Monitoring Parameter</th>
预期输出:Monitoring Parameter
很遗憾,我的模式"<th[^>]*>(.*?)</th>"
不起作用。
预先感谢
答案 0 :(得分:1)
如Mathyn's comment中所述,正则表达式和HTML不能很好地结合在一起。
如果要在C#中使用HTML,我建议您使用HTML Agility Pack,它可以解析HTML并使用LINQ进行浏览。开始时可能会有些令人生畏,但比起使用Regex处理HTML的不规则性,您将有更好的时间。