我刚试过......
lynx -dump -list_inline "http://www.samplepage.com"
获取网页的格式化输出。但是,我注意到对于链接,只标记了起点而不是终点。例如,对于像这样的事情
this is <a href="www.link.com">a link</a> somewhere
我得到了
this is [www.link.com]a link somewhere
但我想得的是像
this is [www.link.com]a link[endlink] somewhere
以便我知道文本的哪一部分确切地包含在链接中。有人知道如何做到这一点吗?
非常感谢你的帮助!
祝你好运, 弗洛里安