由于一个数据集中的列较长,合并会附加额外的值吗?

时间:2019-03-23 11:30:47

标签: r merge

我尝试根据标识符列合并两个数据帧:

NEI <- merge(data, classification, by = "SCC", ) 

其中,数据是原始数据文件,具有通过“ SCC”标识的某些度量,而分类文件则具有“ SCC”值的相应名称。例如,SCC代码10010203对应于“工业废水”。

但是,SCC代码的分类列表比原始数据文件中的测量值/ SCC更为广泛。这样,在合并文件时,在NEI数据帧的末尾,来自分类文件的非重叠SCC代码会附加在与测量和相应名称相对应的SCC值之前(这就是为什么想要合并文件)。

> head(NEI)
   SCC  fips Pollutant Emissions  type year                                               Short.Name
1 10100101 34017  PM25-PRI   898.421 POINT 1999 Ext Comb /Electric Gen /Anthracite Coal /Pulverized Coal

> tail(NEI)
         SCC  fips Pollutant Emissions  type year                                                                 Short.Name
6497646 68510001 47163  PM25-PRI   2.0e-02 POINT 2005                                           Phthalate Plasticizer Production

不应添加NEI帧尾部的“ 6497646”值。如前所述,我认为这是因为两个文件中的两个“ SCC”变量都合并了文件,并且分类/索引文件中的SCC列表较长。

如何确保仅将测量文件中的SCC代码合并到新框架中?

谢谢!

1 个答案:

答案 0 :(得分:0)

这些数字只是行名,如果您不想使用它们,则可以删除所有行名。

rownames(NEI) <- NULL