我想开发一个用于检查多个源代码的抄袭检查器,但我找不到任何正确的源代码甚至是资源来了解它。 我检查过没用的Boss2。他们声称他们使用Sherlock模块来检测抄袭,但似乎boss2中没有这样的工具。
如果有任何开源检测工具可用于检查源代码,请告诉我。 问候
答案 0 :(得分:5)
我知道文本的开源抄袭检测器(例如WCopyFind),但不是代码。
我找不到......甚至是一个了解它的资源。
优秀的闭源工具MOSS的作者发表了一篇有用的paper about the technology。
答案 1 :(得分:2)
我知道这个问题已经过时了,但我确实从谷歌这里登陆了。
Sherlock是一个开源剽窃检测器。 Sherlock's home page is here
答案 2 :(得分:0)
我写了SimiCheck,欢迎您使用它。如果您对API感兴趣,我可能会很快写一个。 我将原始算法编写为CrowdGrader对等分级工具的一部分,但后来我决定独立提供比较工具。 SimiCheck可以处理代码,Word(.docx),html,pdf,text,...,以及.zip,.tar,.gz,.tgz等一些格式,并且可以处理变量重命名,代码移动,跨多个文件的代码等。