我有以下代码
titanic <- titanic %>% mutate(title = ifelse(str_detect(name,"Mr.|Ms.|Mme."), "Hombre casado",
ifelse(str_detect(name, "Master."), "Hombre soltero",
ifelse(str_detect(name, "Miss."), "Mujer soltera",
ifelse(str_detect(name, "Mrs.|Mlle."), "Mujer casada", "Otro")))))
我有以下数据框:
name <- c("Mr Sergio", "Mrs Maria")
surname <- c("Nnunci", "Gonzalez")
df <- data.frame(name, surname)
这个功能的想法是在标题栏中添加他们的婚姻状况,这取决于姓名栏中是否有先生或夫人。
例如,如果在“名称”栏中我有Mr | Ms | Mme(其中一个),那么在标题中我必须加上“Hombre casado”,意思是“已婚男人”。
除了“太太”之外,它运作良好这意味着“已婚妇女”,因为当我将此功能应用于我的数据集时,已婚妇女显示为“Hombre casado”(已婚男子)。我认为这是关于我用于检测类型的模式。
输出:
name surname title
Mr Sergio Nnunci Hombre Casado
Mrs Maria Gonzalez Mujer Casada
有些想法?