标签: r string-matching stringdist
我试图在术语term1和terms2的列表之间进行近似字符串匹配,我希望匹配字符串,包括拼写错误,不同的符号等。我使用
amatch(terms1, terms2, method="osa", maxDist=1, nomatch=0)
我想匹配,例如许可证和许可证,但我不想匹配培训和下雨。 所以我想把大约中的第一个字符排除在外。匹配,以便不考虑删除/替换,但在两个字符串中都必须相同。 怎么可能这样做或有没有更好的方法来正确匹配?
任何帮助表示赞赏!