我有一个显然简单的管道正则表达式查询 - 我需要从它的(<img>
)标签中截断每个项目。我认为用<img[.]*
的字符串正则表达式替换为空白字段的循环会处理它,但无济于事。
显然我在这里缺少一些基本的东西 - 有人可以指出它吗?
现在的项目是这样的:
sample text title
<a rel="nofollow" target="_blank" href="http://example.com"><img border="0" src="http://example.com/image.png" alt="Yes" width="20" height="23"/></a>
<a.... (a bunch of irrelevant hyperlinks I don't need)...
基本上我只想要标题文字和超链接,这就是为什么我要把剩下的东西砍掉
更好一点,因为我在这里真正做的就是通过在进一步操作之前将项目字符串缩小来使其更易于管理 - 任何人都知道是否可以从页面中的某个链接中提取href(在这种情况下,第一个)在Yahoo Pipes中使用Regex?我已经看到了this SO q的正则表达式答案,但我不知道如何使用它来将网址映射到Pipes模块中的item属性?
答案 0 :(得分:0)
您需要使用RegEx管道删除行返回并将内容或描述字段上的空文本替换为模式[\ r \ n]以使其成为单行文本,然后您可以使用。*通配符这将运行到行尾。
http://www.yemkay.com/2008/06/30/common-problems-faced-in-yahoo-pipes/