标签: html regex bash shell sed
目前,我的命令是从HTML中以href开头的行中切出URL:
href
sed -ne 's/.*href="\([^"]*\).*/\1/p'
由于href可以以'或"开头,而我的命令现在仅占",所以我想知道如何为两个{ {1}}和'。
'
"
答案 0 :(得分:4)
/^(<)(.*?)(href=)("|')(.*?)(>)$/gm
or是|。
or
|
()帮助您逐步将字符串分组。
()
这当然不是最好的,但是该在线工具可能会为您提供帮助。