Question

遗憾的是，我已经就此主题提出了所有问题，但我无法将所有信息整合到正常工作的正则表达式中。

我正在尝试使用 yahoo管道替换RSS帖子的内容，其中包含此帖子中包含的链接（HTML格式）。

在帖子中有各种链接，但只有一个链接包含网址和参数我正在寻找。我正在尝试提取 .txt 和 .pdf 文件，filetype的表达式是懒惰的，因为以后有更多指向pdf / txt文件的链接on我想只选择第一个链接（根据我的理解，如果我不使文本延迟，直到文件类型的最后一次出现将被选中）。

链接嵌入如下：

...Previous Link</a> – <a rel="nofollow" target="_blank" href="http://url.net/file/folder/filename.parameter.txt/pdf">description</a> – Next Link <a rel...

我需要选择此链接之前/之后的所有文本，因为我用实际的纯文本链接替换整个选择。到目前为止我想出的是：

((.|\n)*)(http://url.*parameter.*?(txt|pdf))((.|\n)*)

它在Regexr中有效：http://regexr.com/3argq 但不幸的是，当放入雅虎管道时会导致以下错误：

无法完成正则表达式操作

我该如何继续前进？

Answer 1

您需要转义斜杠 - 而不是//写\/\/

正则表达式 - 选择链接和之前/之后的所有内容

1 个答案: