给定的函数在R中使用“stringdist”包,并告诉将一个字符串更改为另一个字符串所需的最小更改。我想知道“%”格式中一个字符串与另一个字符串的相似程度。请帮助我,谢谢。
stringdist("abc","abcd", method = "lv")
答案 0 :(得分:5)
您可以使用RecordLinkage
包并使用函数levenshteinSim
,即
#This gives the similarity
RecordLinkage::levenshteinSim('abc', 'abcd')
#[1] 0.75
#so to get the distance just subtract from 1,
1 - RecordLinkage::levenshteinSim('abc', 'abcd')
#[1] 0.25
答案 1 :(得分:2)
这样的事可能有用:
<container id>
答案 2 :(得分:2)
这是基础R中的一个函数。我添加了一个检查相等长度的向量作为输入。如果需要,您可以更改此逻辑。
strSim("abc", "abcd")
[,1]
[1,] 0.75
返回
<fieldType name="string_tr" class="solr.ICUCollationField" locale="tr" strength="primary" />