我尝试根据标识符列合并两个数据帧:
NEI <- merge(data, classification, by = "SCC", )
其中,数据是原始数据文件,具有通过“ SCC”标识的某些度量,而分类文件则具有“ SCC”值的相应名称。例如,SCC代码10010203对应于“工业废水”。
但是,SCC代码的分类列表比原始数据文件中的测量值/ SCC更为广泛。这样,在合并文件时,在NEI数据帧的末尾,来自分类文件的非重叠SCC代码会附加在与测量和相应名称相对应的SCC值之前(这就是为什么想要合并文件)。
> head(NEI)
SCC fips Pollutant Emissions type year Short.Name
1 10100101 34017 PM25-PRI 898.421 POINT 1999 Ext Comb /Electric Gen /Anthracite Coal /Pulverized Coal
> tail(NEI)
SCC fips Pollutant Emissions type year Short.Name
6497646 68510001 47163 PM25-PRI 2.0e-02 POINT 2005 Phthalate Plasticizer Production
不应添加NEI帧尾部的“ 6497646”值。如前所述,我认为这是因为两个文件中的两个“ SCC”变量都合并了文件,并且分类/索引文件中的SCC列表较长。
如何确保仅将测量文件中的SCC代码合并到新框架中?
谢谢!
答案 0 :(得分:0)
这些数字只是行名,如果您不想使用它们,则可以删除所有行名。
rownames(NEI) <- NULL