喜欢标题,如何比较文字?例如,转到textdiff.com。
答案 0 :(得分:4)
结帐Levenshtein distance。这是一种用于识别两个字符串之间差异的相当通用的算法。
答案 1 :(得分:1)
您可能想看一下Pear的Text_Diff
答案 2 :(得分:1)
答案 3 :(得分:0)
如果您正在寻找终端命令,请查看默认情况下在linux中找到的diff。您也可以通过安装cygwin [带有很多超重行李]在窗户上安装它。 :\]
答案 4 :(得分:0)
我建议使用Jaccard的相似系数。将每个句子作为一个整体处理。