Question

在数据表的“公司名称”列中，一些公司反复使用不同的名称，例如Apple和Apple _请勿致电。我只想考虑一个。如何清除这些数据？重复的公司名称在其他字段中具有相同的值

Company Name     Volume
Apple              150
Wallmart           190
Apple_Do Not Call  150
Sapient            450
Apple inc.         150

如果您关注数据，则苹果公司会反复使用不同的名称。我只考虑1个值，即Apple

Answer 1

您可以在具有相同值（在本例中为“数量”）的不同字段上进行group_by，然后使用mutate将公司名称更改为每个group_by组的第一个值

dt %>% group_by(Volume) %>% mutate(Company_Name = first(Company_Name))

dt这是您的数据表。