可视化文档相似点

时间:2011-04-26 04:00:07

标签: java algorithm document similarity

我们目前正在做一个关于抄袭检测两个文本文件的项目。我们必须比较两份提交的文件并提供比较结果。为此,我想并排展示这两个文档,并突出显示GUI中文档之间的相似点。我使用各种算法来获得两个文档之间的相似性得分,例如向量空间和木瓦云算法。但他们不提供具有相似性的部分,我必须将它们呈现给在图形界面中发生相似性的用户。

感谢名单 Nuwan

1 个答案:

答案 0 :(得分:0)

它真的应该是图形化的吗?你正在比较文字。看起来你想要坚持使用文本界面。但是,你可以使用Swing快速创建一些东西。我可能首先打印出文档共享的带状疱疹和一些上下文。我也试过寻找一些你可以使用的现成的差异引擎,但是很简单。也许您实际上可以以某种方式将Unix diff工具包含或以某种方式合并到您的应用程序中?