在bash中提取特定锚文本的href

时间:2016-11-30 06:35:16

标签: html regex bash

我正在尝试从Exiftool页面获取最新版本的href

curl -s  'http://www.sno.phy.queensu.ca/~phil/exiftool/history.html' | grep -o -E "href=[\"'](.*)[\"'].*Version"

实际输出

href="Image-ExifTool-10.36.tar.gz">Version

我希望这是一个输出

Image-ExifTool-10.36.tar.gz

1 个答案:

答案 0 :(得分:2)

使用grep -P您可以使用前瞻和\K进行匹配重置:

curl -s  'http://www.sno.phy.queensu.ca/~phil/exiftool/history.html' |
grep -o -P "href=[\"']\K[^'\"]+(?=[\"']>Version)"

Image-ExifTool-10.36.tar.gz