有两个相似的id描述,即80%的相似度。我需要两个人同样的身份。
还有其他ID描述具有60%的相似性。这些应该保留自己的ID。一旦考虑并修改了id desc,就不应将其作为参考。进一步 例如:
id id description
1 pepsodent
2 pepsodent salt
3 pepsod
4 pepsodent and salt
5 peps
现在,pepsodent与pepsodent salt匹配。因此两者都应该被赋予id为1 由于已经修改了胃蛋白酶盐,因此不能将其作为参考比例进一步使用。
答案 0 :(得分:0)
正如我在上面的评论中所说,您需要准确定义匹配两条记录的规则。在这个例子中,我给任何包含整个字符串'pepsodent'的记录赋予一个新ID。这些记录的新ID将为999,但您可以根据需要进行修改:
SELECT ID, ID_Description,
CASE
WHEN ID_Description LIKE 'Pepsodent%' THEN 999
ELSE ID
END AS New_ID
FROM Table