如何从“lynx --dump -listonly”中删除编号

时间:2018-04-06 20:11:51

标签: bash url formatting sh lynx

$ lynx --dump -listonly index.html

示例结果:

References

Visible links
1. http://lynx.invisible-island.net/
2. http://lynx.invisible-island.net/lynx.html
3. http://lynx.invisible-island.net/current/index.html

我想要做的是删除1. 2.和3.“引用”和“可见链接”文本。

通缉结果:

http://lynx.invisible-island.net/
http://lynx.invisible-island.net/lynx.html
http://lynx.invisible-island.net/current/index.html

3 个答案:

答案 0 :(得分:4)

您可以使用Lynx的 --nonumbers 选项

lynx --dump -nonumbers -listonly http://lynx.invisible-island.net/

答案 1 :(得分:0)

尝试:

lynx --dump -listonly index.html | sed -r 's/^[0-9]+\. //'

答案 2 :(得分:0)

我有输入,每行顶部都有空格:

 1. http://lynx.invisible-island.net/
 2. http://lynx.invisible-island.net/lynx.html

然后,抑制第1到3行:

lynx --dump -listonly http://lynx.invisible-island.net/ | sed -E 's/^ ?+[0-9]+\. //; 1,3d'

<强>输出

http://lynx.invisible-island.net/
http://lynx.invisible-island.net/lynx.html