我有一些时间序列数据集,例如1960年至2000年期间的GDP增长,外国直接投资和教育。在所有数据集中识别(唯一)变量是country_name
。一些国家存在于一个数据集中但在另一个数据集中存在。我想选择(过滤)所有数据集中存在的国家/地区。如何在R
中完成此操作?
data.frame
看起来如下:
FDI
country 2001 2002 2003 2004 2005
A -0.4769080 -0.89159864 -0.2140591 -0.93326470 -0.1726757
B -0.1246048 0.09929738 1.0522747 0.08724465 -0.9064532
C 1.9592917 1.06080273 0.5316807 -0.94478259 -1.1342767
E -1.0585177 0.58981906 0.5210434 -0.81212231 0.7862898
GDP growth
country 2001 2002 2003 2004 2005
A 0.06323898 0.08537586 0.8982821 -1.3635704 0.45569153
B 1.19848687 1.41307212 0.3358561 -0.8368255 0.22987821
D 1.13491209 -0.98472341 0.7545730 -0.3595143 0.07172593
E 0.83561289 0.51227238 -0.1377516 1.8841489 -0.94319505
我需要选择匹配的情况A,B和E,并将所有内容放在长格式中,最好使用reshape2
。
输出应该看起来像(不包括C和D,因为它们不在两个数据集中):
country year FDI GDP growth
A 2001 -0.4769080 0.06323898
A 2002 -0.89159864 0.08537586
A 2003 -0.2140591 0.8982821
... ...
B 2001 -0.1246048 1.19848687
... ...
... ...
E 2005 0.7862898 -0.94319505
答案 0 :(得分:0)
我们首先使用数据框之间的公共国家创建索引变量,然后使用#!/usr/bin/python
from os import listdir
from PIL import Image as PImage
def loadImages(path):
# return array of images
imagesList = listdir(path)
loadedImages = []
for image in imagesList:
img = PImage.open(path + image)
loadedImages.append(img)
return loadedImages
path = "/path/to/your/images/"
# your images in an array
imgs = loadImages(path)
for img in imgs:
# you can show every image
img.show()
包中的melt
转换为长格式。最后,我们合并reshape2
前两列
by