我正在尝试根据品牌对某些产品进行分组。即使在清理数据之后,产品名称下也存在大量拼写/间距错误。这使得很难归类为品牌。有人可以在这里指导我吗?我想知道如何创建一个函数,我可以使用“以项目开头或包含某些字母的任何单词”并将其链接到“品牌”。
谢谢你
UI
答案 0 :(得分:1)
不确定我是否理解这个问题,但这应该有效:
library(dplyr)
data <- data.frame(test = c("ABC", "BLA", "DRA", "ADC", "AFA" ,"APA", "ZBG", "AGL"))
data_new <- data %>%
mutate(test = if_else(substr(test,1,1) == "A", "AAA", as.character(test)))