使用asp.net解析锚标签

时间:2010-01-06 10:14:41

标签: c# asp.net parsing plaintext

在以纯文本格式解析一堆html时,正则表达式是提取和检查所有锚标记的最佳方法,还是内置于.net lib中的任何内容?

2 个答案:

答案 0 :(得分:1)

RegEx是你的朋友。 BCL中没有内置HTML解析器。

如果您输入XHTML(或符合XML),则可以使用XML和XPath。将文档加载到XmlDocument并选择所有a个节点。

答案 1 :(得分:1)

正则表达式很好。但是我觉得HTML agility pack更宽容一点,而且我会在这种情况下使用它。