标签: c# asp.net parsing plaintext
在以纯文本格式解析一堆html时,正则表达式是提取和检查所有锚标记的最佳方法,还是内置于.net lib中的任何内容?
答案 0 :(得分:1)
RegEx是你的朋友。 BCL中没有内置HTML解析器。
如果您输入XHTML(或符合XML),则可以使用XML和XPath。将文档加载到XmlDocument并选择所有a个节点。
XmlDocument
a
答案 1 :(得分:1)
正则表达式很好。但是我觉得HTML agility pack更宽容一点,而且我会在这种情况下使用它。