Question

我想在数据框的列中找到一个特定值，然后替换为我想要的任何值。

例如，我有一个数据框，其中包含城市名称（第1列）和频率（第2列）。但是有些城市有不同的区域，因此R看起来像不同的城市，因为它们的行名称不同。

示例：

- ＆GT;我有：

      City     Freq
1    Paris 01   69
2    Paris 03   60
3    Paris 15   12
4    Paris 20   2
5    Toulouse   60
6    Paris      15
7    Lille      12

- ＆GT;我想：

      City Freq
1    Paris   69
2 Toulouse   60
3    Lille   12

我尝试使用gsub函数，但我不知道如何处理它。我也尝试了一些if语句，但我失败了。在发布内容之前，我确实试图找到一些答案，但我发现的示例更简单，只涉及所有列的更改（等等......）。

感谢您帮助我！

这里有一些关于我的数据的信息：

dput(droplevels(head(data))) 

structure(list(City = structure(c(1L, 4L, 3L, 5L, 2L, 6L), .Label = c("PARIS", "PARIS 13", "PARIS 15", "PARIS 16", "PARIS 18", "PARIS 20"), class = "factor"), Freq = c(8859L, 3843L, 3583L, 2651L, 2586L, 2464L)), .Names = c("City", "Freq"), row.names = c(19380L, 19396L, 19395L, 19398L, 19393L, 19400L), class = "data.frame")

Answer 1

您可以修改＆＃39; City＆＃39;使用sub

的列

df2 <- transform(df1, City=tolower(sub("\\s+.*$", '', City)))
res <- aggregate(Freq~City,df2, FUN=sum)
res
#     City Freq
#1    lille   12
#2    paris   69
#3 toulouse   60

res$City <- sprintf('%s%s', toupper(substr(res$City,1,1)),
                 sub('^.', '', res$City))

数据

df1 <- structure(list(City = structure(c(3L, 4L, 5L, 6L, 7L, 2L, 1L), 
.Label = c("Lille", 
"Paris", "Paris 01", "Paris 03", "Paris 15", "PARIS 20", "Toulouse"
), class = "factor"), Freq = c(12, 15, 25, 2, 60, 15, 12)),
.Names =    c("City", 
"Freq"), row.names = c(NA, -7L), class = "data.frame")

在R中查找和替换值

1 个答案:

数据