比较防火墙后面的两个HTML页面

时间:2012-04-16 02:45:06

标签: comparison

我有两个HTML页面,其中页面的内容是第1列和第2列。 Column1在两个页面中具有相同的数据,而第2列是不同的(将第2列视为计数器值)。我如何比较这两页

我拥有的选项:

1)使用我使用的工具(SoapUI可能)来编写脚本并解析每个html页面 2)使用一些可用于Java / Perl / Python的内置库

我正在寻找像quickdiff.com这样的方式。

注意:html页面是防火墙的,并且公众无法访问,因此互联网上提供的差异工具不起作用。这两个html页面是来自同一网站的实例。

有关如何解决此问题的任何指示?

由于

编辑:正如我所提到的,html页面包含两列,其中第1列在两个页面中相同,而column2是计数器值。如果column1的值为“a”且column2为1在第1页中,column1也是“a”,第2页中的column2是2,diff命令将这些视为不同。我想把它们视为一样。换句话说,忽略column2并且只看到column1

中的差异

1 个答案:

答案 0 :(得分:0)

您可以使用wgetdiff来显示差异:

diff <(wget -q -O - http://www.site1.com/) <(wget -q -O - http://www.site2.com/)