我遇到了Yahoo管道的问题。
我正在尝试获取位于item.title末尾的网址(RSS Feed) 我想在item.link中使用该URL
我使用正则表达式来获取网址(((f | ht){1} tp://)[ - a-zA-Z0-9 @:%_ +。〜#?& // =] +)并且工作正常。
但是如何使用它来将它用于item.link?
现在看起来像这样:
..
<item>
<title>
Hello this is a test http://www.google.com
</title>
<link>
http://otherurl
</link>
<description>
Hello this is a test http://www.google.com
</description>
<guid isPermaLink="false">
http://otherurl
</guid>
<pubDate>Tue, 24 Jan 2012 18:27:18 +0000</pubDate>
</item>
..
我想这样做:
..
<item>
<title>
Hello this is a test http://www.google.com
</title>
<link>
http://www.google.com
</link>
<description>
Hello this is a test http://www.google.com
</description>
<guid isPermaLink="false">
http://otherurl
</guid>
<pubDate>Tue, 24 Jan 2012 18:27:18 +0000</pubDate>
</item>
..
答案 0 :(得分:0)
使用Regex module将item.title
复制到item.link
,然后修改item.link
:
1)在item.link
.*
替换${title}
2)在item.link
替换".* "
(不带引号,请注意末尾的空格)""
(空)
答案 1 :(得分:0)
我找到了!它应该是
^.*(((f|ht){1}tp://)[-a-zA-Z0-9@:%_\+.~#?&//=]+).*$
它会选择所有内容,直到找到一个网址!