Question

我尝试根据标识符列合并两个数据帧：

NEI <- merge(data, classification, by = "SCC", )

其中，数据是原始数据文件，具有通过“ SCC”标识的某些度量，而分类文件则具有“ SCC”值的相应名称。例如，SCC代码10010203对应于“工业废水”。

但是，SCC代码的分类列表比原始数据文件中的测量值/ SCC更为广泛。这样，在合并文件时，在NEI数据帧的末尾，来自分类文件的非重叠SCC代码会附加在与测量和相应名称相对应的SCC值之前（这就是为什么想要合并文件）。

> head(NEI)
   SCC  fips Pollutant Emissions  type year                                               Short.Name
1 10100101 34017  PM25-PRI   898.421 POINT 1999 Ext Comb /Electric Gen /Anthracite Coal /Pulverized Coal

> tail(NEI)
         SCC  fips Pollutant Emissions  type year                                                                 Short.Name
6497646 68510001 47163  PM25-PRI   2.0e-02 POINT 2005                                           Phthalate Plasticizer Production

不应添加NEI帧尾部的“ 6497646”值。如前所述，我认为这是因为两个文件中的两个“ SCC”变量都合并了文件，并且分类/索引文件中的SCC列表较长。

如何确保仅将测量文件中的SCC代码合并到新框架中？

谢谢！

Answer 1

这些数字只是行名，如果您不想使用它们，则可以删除所有行名。

rownames(NEI) <- NULL

由于一个数据集中的列较长，合并会附加额外的值吗？

1 个答案: