使用grep从html文件中获取src属性

时间:2017-05-18 18:08:14

标签: regex grep

如何链接grep以匹配双引号之间的图像?

$ cat final.html | grep -Po 'src=\".*?\"'
src="Remix-OS-Download-Option.png"
src="VMSetup1.png"
src="VMSetup2.png"
src="VMSetup3_001.png"
src="VMSetup4.png"
src="VMSetup5.png"
src="VMSetup6.png"

预期结果:

Remix-OS-Download-Option.png
VMSetup1.png
...
VMSetup6.png

1 个答案:

答案 0 :(得分:2)

希望这会有所帮助。正如我们在这里使用perl正则表达式,您可以查看演示here

通过以下方式管道您的命令: grep -Po '="\K[^"]+'

正则表达式: ="\K[^"]+

  

1。 ="\K这将匹配="\K将重置当前匹配。

     

2。 [^"]+匹配除"

以外的所有内容

完成命令:

cat final.html | grep -Po 'src=\".*?\"' | grep -Po '="\K[^"]+'

您可以选择尝试以下选项: cat final.html | grep -Po 'src="\K[^"]+'