无法匹配两个数据帧值

时间:2016-08-05 14:07:26

标签: r

我不确定为什么数据帧值彼此不匹配。 我有一个df名称fileUpload,看起来像这样(cols正确对齐):

Destination City    Year    Adults
Amsterdam   2015    2
Amsterdam   2016    2
Amsterdam   2015    2
Amsterdam   2016    2
Amsterdam   2015    3

每个城市名称后面都有一个空格。

我有另一个未上传的数据框,如下所示:

cities <- read.csv(text = "
      City,Lat,Long,Pop
      Amsterdam ,4.8952,52.3702,779808
      Bali ,115.1889,-8.4095,4225000")

我需要合并两个数据帧,但我意识到城市值返回不匹配(NA)。我尝试使用fileUpload %in% cities返回false

进行检查 我尝试在城市之后移除空间,也没有工作。 两者的typeof(df$city)都是整数。

如何让城市名称匹配?

1 个答案:

答案 0 :(得分:0)

正如评论中所指出的,您应该将列转换为因子中的字符串。

mergedCities <- merge(fileUpload, cities, by.x ="Destination City", by.y = "City", all = TRUE)

设置all参数以指定是要保留所有城市还是只保留一个x或y形式,或仅保留两者中的城市。