我需要解析一个巨大的页面...用这样的字符串:
<li class="specialclass"><a href="http://some.changingurl.com" ..(some changing classes)..>
我需要将上面的内容改为:
<li class="specialclass">http://some.changingurl.com<a href="http://some.changingurl.com" ..(some changing classes)..>
然后我可以删除所有的html标签,但保存网址。只有网址正在改变。
请帮我写一个替代品。
谢谢。
答案 0 :(得分:0)
sed -r 's/<a href="([^["]*)"/\1&/' input-file >new-file
这个oneliner就可以了。