获取矩形区域中的链接网址

时间:2015-05-23 18:21:27

标签: java javascript html browser browser-extension

我经常需要HTML页面上矩形区域中链接的URL。这个矩形区域通常是表格的列。我需要在我的java程序中使用这些URL进行进一步处理。

我一直在考虑这个问题超过一个月,但没有找到一个好的解决方案。这里有一些我的想法:

方法1:最简单的方法可能是使用一些浏览器扩展,您可以在MS Paint中绘制矩形,并将矩形内所有链接的URL复制到剪贴板(例如,通过行分隔符分隔不同的链接)。然后我的java程序只需要读出剪贴板来提取URL。

不幸的是,我从未开发过浏览器扩展程序,因此我对此知之甚少。

没有接近:只是尝试选择链接并按ctrl+c将其复制到剪贴板,然后使用Java解析它们将无法工作,因为选择还将包含其他专栏。

方法2:由于我有使用javascript的经验,我还想到了一些greasemonkey脚本,它记录了在键盘上按住某个键时你所盘旋的URL。不幸的是,javascript无法将URL复制到剪贴板,因此可能更多地涉及将它们传输到java程序。

方法3:第三种方法可以是直接使用页面的HTML代码并以某种方式识别表格。但是在这里你必须解析HTML,也没什么好看的。

你有解决这个问题的方法吗?我可以找到适用于Chrome或Firefox的解决方案。

1 个答案:

答案 0 :(得分:1)

如果它是表格的一列,为什么不将表格复制到Excel,然后使用此how-to提取链接。

作为另一种方法,浏览器扩展很容易制作,我认为应该知道它们非常强大(就可能的应用而言)。 查看有关创建浏览器扩展程序的this lifehacker post。您还可以使用extensionizr轻松创建浏览器扩展程序。

编辑:

同样对于方法2 ,请在脚本而不是剪贴板上尝试console.log(url),然后从控制台复制整个URL列表。