$ lynx --dump -listonly index.html
示例结果:
References
Visible links
1. http://lynx.invisible-island.net/
2. http://lynx.invisible-island.net/lynx.html
3. http://lynx.invisible-island.net/current/index.html
我想要做的是删除1. 2.和3.“引用”和“可见链接”文本。
通缉结果:
http://lynx.invisible-island.net/
http://lynx.invisible-island.net/lynx.html
http://lynx.invisible-island.net/current/index.html
答案 0 :(得分:4)
您可以使用Lynx的 --nonumbers 选项
lynx --dump -nonumbers -listonly http://lynx.invisible-island.net/
答案 1 :(得分:0)
尝试:
lynx --dump -listonly index.html | sed -r 's/^[0-9]+\. //'
答案 2 :(得分:0)
我有输入,每行顶部都有空格:
1. http://lynx.invisible-island.net/
2. http://lynx.invisible-island.net/lynx.html
然后,抑制第1到3行:
lynx --dump -listonly http://lynx.invisible-island.net/ | sed -E 's/^ ?+[0-9]+\. //; 1,3d'
<强>输出强>
http://lynx.invisible-island.net/
http://lynx.invisible-island.net/lynx.html