无法合并SPSS中的数据

时间:2016-12-12 00:53:50

标签: python merge spss

我有两个数据集,我们称之为D1D2D2包含一些我要添加到D1的变量。 D2本质上是来自D1的一组数据,但有一个额外的变量。问题是,我似乎无法使用Merge因为Name字符串变量已在D2中切换。如同在D1中,变量Name的每个条目都显示为Word1 Word2,而D2中的每个条目都显示为Word2 Word1

如何在D1中找到D2中也出现的条目,并在D2中添加缺少的变量?

非常高兴使用Python来解决这个问题。

1 个答案:

答案 0 :(得分:1)

首先让我们创建一个工作示例:

<script src="https://ajax.googleapis.com/ajax/libs/jquery/2.1.1/jquery.min.js"></script>

<body>
  <a href="#menu-toggle" onclick="menu_toggle_click(event)" class="btn btn-default" id="menu-toggle">Menu</a>
  <!-- <script src="your-file.js" type="text/javascript"></script> -->
</body>

现在我们希望使用data list list/name (a20) v1 (f1) v2(f1). begin data "hello world" 1 2 "huff puff" 3 4 "word1 word2" 5 6 end data. dataset name D1. data list list/name (a20) y1 (f1) y2(f1). begin data "world hello" 11 12 "puff huff" 13 14 "word2 word1" 15 16 end data. dataset name D2. 作为关键字匹配这两个文件,但name中的字在D2中相反。所以首先我们必须把它们按顺序排好,取第二个字并将它放在第一个字的前面:

name

现在我们可以继续匹配文件:

dataset activate D2.
rename variables name=Rname.
string name #n1 #n2(a20).
compute #n2=substr(Rname,1,index(Rname," ")).
compute #n1=substr(Rname,index(Rname," ")+1,20).
compute name=concat(rtrim(#n1), " ", rtrim(#n2)).
sort cases by name.