遗憾的是,我已经就此主题提出了所有问题,但我无法将所有信息整合到正常工作的正则表达式中。
我正在尝试使用 yahoo管道替换RSS帖子的内容,其中包含此帖子中包含的链接(HTML格式)。
在帖子中有各种链接,但只有一个链接包含网址和参数我正在寻找。我正在尝试提取 .txt
和 .pdf
文件,filetype的表达式是懒惰的,因为以后有更多指向pdf / txt文件的链接on我想只选择第一个链接(根据我的理解,如果我不使文本延迟,直到文件类型的最后一次出现将被选中)。
链接嵌入如下:
...Previous Link</a> – <a rel="nofollow" target="_blank" href="http://url.net/file/folder/filename.parameter.txt/pdf">description</a> – Next Link <a rel...
我需要选择此链接之前/之后的所有文本,因为我用实际的纯文本链接替换整个选择。 到目前为止我想出的是:
((.|\n)*)(http://url.*parameter.*?(txt|pdf))((.|\n)*)
它在Regexr中有效:http://regexr.com/3argq 但不幸的是,当放入雅虎管道时会导致以下错误:
无法完成正则表达式操作
我该如何继续前进?
答案 0 :(得分:1)
您需要转义斜杠 - 而不是//
写\/\/