我有2个数据集,1个包含旅行信息,另一个包含每次旅行的费用,具体取决于我要离开的地方。我需要获得旅行的总费用,并且我可以很容易地通过我离开的地方进行合并,但是当我这样做时,它会向我的100,000行数据集添加1,500行。
谁知道为什么会这样?最大的数据集是100,000行,另一个是大约10,000行
编辑
这是df1的一个子集
x Poste Locat V3
1 905916 Mixco 0.3
2 905818 Mixco 0.6
3 905818 Mixco 0.6
4 905338 Castellana 0.5
5 904876 Mixco 0.3
这是df2的一个子集
x Vehiculo Poste
1 Camion 340592
2 Camion 262776
3 Camion 340622
4 Camion 243254
5 Camion 258505
我需要使用“Poste”合并两个数据集,因为我将从另一个数据集中获得基于“Locat”(位置)和“Vehiculo”(车辆)的成本。
sol <- merge(sol, df[,c(5,16)], by="Poste")