我有一个由许多字符串组成的文件。对于每个字符串,我想创建长度为4的子字符串,然后将每个子字符串与另一个SPSS文件中的单词字典进行比较。例如,如果我有字符串" transport"我想创建一个包含4个字母的字符串列表(例如,' tran',' rans',' ansp'等)。对于这些4个字母的字符串中的每一个,我想知道它是否存在于具有长字列表的另一个文件中。这是我在SPSS中的语法:
* rawNonword是我第一个文件中字符串的名称。
compute chars = char.length(rawNonword)。
字符串持有人(A50)。
将#i = 1循环到chars-4。
compute holder = char.substr(rawNonword,#i,4)。
*这里我想将持有者与另一个文件中的字符串进行比较。
结束循环。
执行。
我意识到合并和匹配函数通常在SPSS中使用,但似乎我不能在循环中使用它们。我相信这个问题在python中相当容易,但我需要在SPSS中完成这个任务。在SPSS中是否有一个简单的函数,如果另一个文件中存在4个字母的字符串,它将返回值1或true?
答案 0 :(得分:0)
使用带有extendedTransforms.vlookup函数的Python插件当然更容易,但在传统语法中,您可以创建一个包含所有四个字母片段的变量,对这两个文件进行排序,并使用TABLE匹配MATCH文件变量作为关键。