计算字符串相似度百分比

时间:2017-09-27 11:14:20

标签: r stringdist

给定的函数在R中使用“stringdist”包,并告诉将一个字符串更改为另一个字符串所需的最小更改。我想知道“%”格式中一个字符串与另一个字符串的相似程度。请帮助我,谢谢。

stringdist("abc","abcd", method = "lv")

3 个答案:

答案 0 :(得分:5)

您可以使用RecordLinkage包并使用函数levenshteinSim,即

#This gives the similarity
RecordLinkage::levenshteinSim('abc', 'abcd')
#[1] 0.75

#so to get the distance just subtract from 1, 
1 - RecordLinkage::levenshteinSim('abc', 'abcd')
#[1] 0.25

答案 1 :(得分:2)

这样的事可能有用:

<container id>

答案 2 :(得分:2)

这是基础R中的一个函数。我添加了一个检查相等长度的向量作为输入。如果需要,您可以更改此逻辑。

strSim("abc", "abcd")
     [,1]
[1,] 0.75

返回

<fieldType name="string_tr" class="solr.ICUCollationField"  locale="tr" strength="primary"  />