我一直在MSDN上阅读.NET中的正则表达式,但我无法弄清楚正确的模式是什么。我需要提取'width =“200”height =“200”/>'来自HTML文件。我需要引号和它。我应该使用的正确模式是什么?
答案 0 :(得分:1)
给定一个特定的HTML页面,您可以制作一个可以提取该页面属性的正则表达式。但是,如果您只有一个特定页面,则可以对其属性值进行硬编码。但是你可能希望能够从任何页面中提取属性值,对吧?你不能用正则表达式做到这一点。真的,你不能,并且试图这样做会导致你陷入无限的失败循环。
使用HTML Agility Pack;它的设计完全符合您的要求;即使是不正确的真实HTML。