我们是一家运行jdk 1.6的java商店。我最近被要求调查将由质量保证团队比较两份文件的软件。这不是一个程序化的练习,而是研究一种可以在我们现在拥有的原始文档和从我们的代码生成的文档之间进行物理比较的产品。
原因是我们最近升级了我们的文档处理软件:Windward Reports和QA希望确保新文档在所有方面与旧文档完全相同。这包括布局和字体大小等内容。这些是对字体大小,类型等有要求的合法合同文件......他们已经有一个名为XTest的EMC产品,但我不知道是否有开源或其他商业产品可能做得更好工作。
需要注意的是,我们没有正式的文档存储库,因为文档存储在我们的数据库中,我们有超过2k的文档,格式不同:word,excel,pdf和rtf。可能还有一些其他类型,如text和csv。我认为手动执行此操作将是一个真正的挑战,但我不知道如何在不编写大量代码的情况下自动执行此操作,因此我认为这不是一个选项。
答案 0 :(得分:0)
你可能会得到一些类似于大学使用的抄袭软件。它应该在文本中找到所有相似之处,但是我不确定它们是否检测到布局/字体大小。
答案 1 :(得分:0)
我们选择了混合解决方案。我发现XTest适用于一些旧的文件格式和pdf,但不适用于rtf甚至txt文件。所以我创建了一个实用程序,通过将我的实用程序分别指向每个代码库来运行旧的iText代码或新的iText代码。我还发现,迎风报告使用了iText。
我们用于生成pdf的rtf文件必须手动处理以进行比较,但是文件的生成可以使用该实用程序完成,而不是让某人尝试通过代码手动执行该任务。 Xtest似乎非常适合处理pdf文件。