比较文件中的差异

时间:2015-03-21 19:01:01

标签: java hadoop diff

我有一个应用程序可以找出两个文件夹之间的差异。它提供了在新文件夹中修改的所有文件的报告。创建的报告是一个显示Diff的html报告。至于现在我已经在普通的java中实现了它,并在tomcat上部署的spring框架中创建了一个web应用程序,它运行良好。

现在用户群非常庞大,人们开始提供1 GB的文件夹。我的申请就此消失了。目前在我的核心逻辑中,我将文件作为字符串数组,然后将每个数组元素与第二个数组中相应的数组元素进行比较,并使用算法来处理添加和删除。

我想让我的应用程序支持GB的数据并找到Diff。我不确定它在Java中是否很容易实现。我只有Hadoop的基本概念。是否真的可以使用Hadoop? 。是否有一个指针可以从中开始构建应用程序?

---------添加有关应用程序的更多信息-----------------

我们的产品应用程序确实包含许多元数据xml文件。某些错误可能会破坏xml文件。在这些情况下,临时修复是提供清理(纠正损坏的xmls)。为了跟踪这个清理活动,我们有这个工具,它要求进行清理的开发人员提供Old Meta数据文件夹和Cleaned Meta数据文件夹。我们创建了审核报告,这些报告将进入管理周期以供审核和批准

提前感谢您的帮助。

B1

0 个答案:

没有答案