如果两个字符串具有80%的相似性,如何给它们提供相同的ID?

时间:2016-08-01 17:22:21

标签: sql python-2.7 excel-vba vba excel

有两个相似的id描述,即80%的相似度。我需要两个人同样的身份。

还有其他ID描述具有60%的相似性。这些应该保留自己的ID。一旦考虑并修改了id desc,就不应将其作为参考。进一步 例如:

id       id description
1        pepsodent
2        pepsodent salt
3        pepsod
4        pepsodent and salt
5        peps

现在,pepsodent与pepsodent salt匹配。因此两者都应该被赋予id为1 由于已经修改了胃蛋白酶盐,因此不能将其作为参考比例进一步使用。

1 个答案:

答案 0 :(得分:0)

正如我在上面的评论中所说,您需要准确定义匹配两条记录的规则。在这个例子中,我给任何包含整个字符串'pepsodent'的记录赋予一个新ID。这些记录的新ID将为999,但您可以根据需要进行修改:

SELECT ID, ID_Description, 
CASE
WHEN ID_Description LIKE 'Pepsodent%' THEN 999
ELSE ID
END AS New_ID
FROM Table