希望有人可以帮助我。我有一个文本文件,其中包含多行XML格式的RSS URL列表。文本文件如下所示:
<outline type="rss" text="Tech Viral" title="Tech Viral" xmlUrl="http://feeds.feedburner.com/TechViral" htmlUrl="https://techviral.net"/>
<outline type="rss" text="The Verge" title="The Verge" xmlUrl="http://www.theverge.com/rss/full.xml" htmlUrl="https://www.theverge.com/"/>
<outline type="rss" text="Joystiq" title="Joystiq" xmlUrl="http://www.joystiq.com/rss.xml" htmlUrl="https://www.engadget.com/rss.xml"/>
<outline type="rss" text="BGR" title="BGR" xmlUrl="http://www.boygeniusreport.com/feed/" htmlUrl="http://bgr.com"/>
我想摆脱以前的一切:
xmlUrl="
以及之后的一切:
"
所以最终输出看起来像这样:
http://feeds.feedburner.com/TechViral
http://www.theverge.com/rss/full.xml
http://www.joystiq.com/rss.xml
http://www.boygeniusreport.com/feed/
基本上,我只想让文件中的供稿网址留在一行。任何人都可以帮忙吗?我在Windows上使用Notepad ++,但如果有另一个软件比正则表达式更容易,我会采取任何建议来完成工作。
谢谢大家!
答案 0 :(得分:2)
不需要花哨
查找(?m)^.*xmlUrl="([^"]*)".*
替换$1
答案 1 :(得分:1)