我如何比较html页面上下载链接的两个doc文件?我目前在Java工作。我想从两个单独的URL中提取两个文件然后比较它们(删除间距,可能使用trim?)
我也在使用Watij,但我认为它不具备这种能力。
编辑:如果网页有多个名为“下载文件”的超链接,有没有办法列出所有网址而不是真正了解它们并手动编码?
答案 0 :(得分:2)
比较两个文件。打开文件作为输入流并使用IOUtils
URL url1 = new URL("http://path/file1.txt");
URL url2 = new URL("http://path/file2.txt");
InputStream is1 = url1.openStream();
InputStream is2 = url2.openStream();
if( IOUtils.contentEquals( is1, is2 ) )
{
//the same content
}