正则表达式 - 选择链接和之前/之后的所有内容

时间:2015-04-19 09:22:03

标签: html regex yahoo-pipes

遗憾的是,我已经就此主题提出了所有问题,但我无法将所有信息整合到正常工作的正则表达式中。

我正在尝试使用 yahoo管道替换RSS帖子的内容,其中包含此帖子中包含的链接(HTML格式)。

在帖子中有各种链接,但只有一个链接包含网址参数我正在寻找。我正在尝试提取 .txt .pdf 文件,filetype的表达式是懒惰的,因为以后有更多指向pdf / txt文件的链接on我想只选择第一个链接(根据我的理解,如果我不使文本延迟,直到文件类型的最后一次出现将被选中)。

链接嵌入如下:

...Previous Link</a> – <a rel="nofollow" target="_blank" href="http://url.net/file/folder/filename.parameter.txt/pdf">description</a> – Next Link <a rel...

我需要选择此链接之前/之后的所有文本,因为我用实际的纯文本链接替换整个选择。 到目前为止我想出的是:

((.|\n)*)(http://url.*parameter.*?(txt|pdf))((.|\n)*)

它在Regexr中有效:http://regexr.com/3argq 但不幸的是,当放入雅虎管道时会导致以下错误:

  

无法完成正则表达式操作

我该如何继续前进?

1 个答案:

答案 0 :(得分:1)

您需要转义斜杠 - 而不是//\/\/