变量之间的近似值

时间:2017-05-23 09:42:46

标签: spss

我有一个包含大量双联的数据集。我想在双变量之间搜索近似的一致性,因为它们没有完全相同的名称。我想比较它们,以便我可以决定删除哪一个。变量是彼此非常相似的前缀和后缀,只是在几个字母中有所不同,有时只是逗号或空格。例如,我有一个名为" Smith"并且下一个案例被命名为" Smithh",但案件是同一个人。我该如何合并?

提前感谢您的帮助!

1 个答案:

答案 0 :(得分:1)

您正在寻找的是概率记录链接,也称为概率匹配。与确定性记录链接相反,由MATCH FILES命令提供。概率记录链接不是SPSS的标准功能,但需要额外的软件。