从内容中提取html标记:在Yahoo Pipes中编码

时间:2014-08-30 19:19:25

标签: regex rss feed src yahoo-pipes

这是我的管道:link

我需要获取内容中的img标记的src属性:encoded

这是内容:由Feed编码:

<p style="text-align:justify;"><img class="alignnone size-full wp-image-49549" src="http://i2.wp.com/heshootshescoores.com/wp-content/uploads/2014/08/nhl.jpg?resize=600%2C400" alt="nhl"/></p>
<p style="text-align:justify;">...etc.

所以在这个例子中我想提取这个链接:ttp://i2.wp.com/heshootshescoores.com/wp-content/uploads/2014/08/nhl.jpg?resize = 600%2C400

并将此属性导出到新的item.media:像这样的

<media:thumbnail xmlns:media="http://search.yahoo.com/mrss/" 
url="HERE GOES THE SRC ATTRIBUTE.png"/>

是否可以使用Yahoo!管道?(我正在考虑正则表达式,但我不熟悉,我甚至不知道从哪里开始。)

谢谢


FU问题:https://stackoverflow.com/questions/25605740/add-items-attribute-in-yahoo-pipes

1 个答案:

答案 0 :(得分:1)

   (.*?)(?=src=)src=\"(.*?)\"(.*)

这样可行。

参见演示。

http://regex101.com/r/bJ6rZ5/3