过滤来自R中不同数据集的匹配案例

时间:2016-04-21 15:18:57

标签: r filter

我有一些时间序列数据集,例如1960年至2000年期间的GDP增长,外国直接投资和教育。在所有数据集中识别(唯一)变量是country_name。一些国家存在于一个数据集中但在另一个数据集中存在。我想选择(过滤)所有数据集中存在的国家/地区。如何在R中完成此操作? data.frame看起来如下:

FDI
country       2001        2002       2003        2004       2005
   A    -0.4769080 -0.89159864 -0.2140591 -0.93326470 -0.1726757
   B    -0.1246048  0.09929738  1.0522747  0.08724465 -0.9064532
   C     1.9592917  1.06080273  0.5316807 -0.94478259 -1.1342767
   E    -1.0585177  0.58981906  0.5210434 -0.81212231  0.7862898

GDP growth
country       2001        2002       2003       2004        2005
   A    0.06323898  0.08537586  0.8982821 -1.3635704  0.45569153
   B    1.19848687  1.41307212  0.3358561 -0.8368255  0.22987821
   D    1.13491209 -0.98472341  0.7545730 -0.3595143  0.07172593
   E    0.83561289  0.51227238 -0.1377516  1.8841489 -0.94319505

我需要选择匹配的情况A,B和E,并将所有内容放在长格式中,最好使用reshape2

输出应该看起来像(不包括C和D,因为它们不在两个数据集中):

country    year      FDI            GDP growth
  A        2001   -0.4769080        0.06323898
  A        2002   -0.89159864       0.08537586
  A        2003   -0.2140591        0.8982821
  ... ...
  B        2001   -0.1246048        1.19848687
  ... ...
  ... ...
  E        2005    0.7862898       -0.94319505

1 个答案:

答案 0 :(得分:0)

我们首先使用数据框之间的公共国家创建索引变量,然后使用#!/usr/bin/python from os import listdir from PIL import Image as PImage def loadImages(path): # return array of images imagesList = listdir(path) loadedImages = [] for image in imagesList: img = PImage.open(path + image) loadedImages.append(img) return loadedImages path = "/path/to/your/images/" # your images in an array imgs = loadImages(path) for img in imgs: # you can show every image img.show() 包中的melt转换为长格式。最后,我们合并reshape2前两列

by