我经常需要HTML页面上矩形区域中链接的URL。这个矩形区域通常是表格的列。我需要在我的java程序中使用这些URL进行进一步处理。
我一直在考虑这个问题超过一个月,但没有找到一个好的解决方案。这里有一些我的想法:
方法1:最简单的方法可能是使用一些浏览器扩展,您可以在MS Paint中绘制矩形,并将矩形内所有链接的URL复制到剪贴板(例如,通过行分隔符分隔不同的链接)。然后我的java程序只需要读出剪贴板来提取URL。
不幸的是,我从未开发过浏览器扩展程序,因此我对此知之甚少。
没有接近:只是尝试选择链接并按ctrl+c
将其复制到剪贴板,然后使用Java解析它们将无法工作,因为选择还将包含其他专栏。
方法2:由于我有使用javascript的经验,我还想到了一些greasemonkey脚本,它记录了在键盘上按住某个键时你所盘旋的URL。不幸的是,javascript无法将URL复制到剪贴板,因此可能更多地涉及将它们传输到java程序。
方法3:第三种方法可以是直接使用页面的HTML代码并以某种方式识别表格。但是在这里你必须解析HTML,也没什么好看的。
你有解决这个问题的方法吗?我可以找到适用于Chrome或Firefox的解决方案。
答案 0 :(得分:1)
如果它是表格的一列,为什么不将表格复制到Excel,然后使用此how-to提取链接。
作为另一种方法,浏览器扩展很容易制作,我认为应该知道它们非常强大(就可能的应用而言)。 查看有关创建浏览器扩展程序的this lifehacker post。您还可以使用extensionizr轻松创建浏览器扩展程序。
编辑:
同样对于方法2 ,请在脚本而不是剪贴板上尝试console.log(url),然后从控制台复制整个URL列表。