考虑以下两个字符串: applesauce
和 apple-sauce
。这些是指同一个对象。因此,包含这两个名称的任何记录都将被视为重复。但是,在R中,这些被认为是单独的级别。可以使用编辑距离来量化这两个名称使用 stringdist
包的相似程度吗?
答案 0 :(得分:0)
这个怎么样。
"applesauce"==gsub("-","","apple-sauce")
对于"applesauce"=="apple - sauce"
这样的多个参数,您可以使用此Replace multiple arguments with gsub