雅虎管道正则表达式提取超链接

时间:2015-05-19 15:48:23

标签: regex hyperlink pipe extract yahoo-pipes

我正在使用Yahoo管道从Reddit获取RSS提要以便稍后与其他提要结合使用。

该项目的链接重定向回Reddit。我希望它能重定向到实际内容。

为了让我这样做,我需要从item.description中提取一个超链接,并用它替换item.link。

http://i.stack.imgur.com/kYJZf.png

我知道我需要使用Regex模块来执行此操作。

我尝试过在Stack Overflow上找到的其他正则表达式命令的变体,但是我无法让它们做我需要的。

有人知道如何用item.description中的URL替换item.link吗?

1 个答案:

答案 0 :(得分:0)

对于任何正在努力使用雅虎管道的人来说,这就是你的做法

从“获取Xpath”模块开始

输入网址,在本例中为https://www.reddit.com/r/unitedkingdom

转到网址,然后点击浏览器中的“查看来源”(Chrome中的F12)

选择包含所有Reddit帖子的“框架”的路径。在这种情况下,它是:// * [@ id =“siteTable”] / div

下一个模块 - “创建RSS”

标题:item.div.1.p.0.a.content

链接:item.div.1.p.0.a.href

默认情况下,Reddit链接是“item.div.1.ul.li.0.a.href”,它将引导您进入Reddit评论部分,但指向我想要的内容的链接位于“item”下.div.1.p.0.a.href”。

然后,这将创建一个带有标题的RSS源,然后直接创建一个链接到内容,而不是Reddit评论部分。