正则表达式rel标签

时间:2010-06-22 01:17:10

标签: regex

我想使用正则表达式从HTML源代码中的html css链接标记中获取网址

例如

<link rel="apple-touch-icon" href="http://sample.com/icons/apple-touch-icon.png">

任何帮助??

1 个答案:

答案 0 :(得分:4)

标准响应:不要使用正则表达式来读取XML,尤其是HTML。使用HTML解析器。

现实回应:如果您正在使用的输入是一致可预测,那么这可能对您有用:

/<link\s+rel="([^"]*)"/

如果您的问题中的示例中的输入几乎 ,则会中断。以下是有效HTML的示例,它们不适用于正则表达式:

<link rel=apple-touch-icon>
<link rel='apple-touch-icon'>
<link href='...' rel='apple'>
<link
   rel="apple">
<link rel = "apple">

等等......你可以尝试扩展正则表达式来迎合其中的一些,但你会进入一个受伤的世界。

编辑:抱歉,我刚注意到您想要href。以上仍然适用,只需根据需要用'href'替换'rel'。