我有一个数据框,想要提取第一个单词并将其插入新列
is_contact
将其转换为:
Dataframe1:
COL1
Nick K Jones
Dave G Barros
Matt H Smith
答案 0 :(得分:20)
您可以使用正则表达式("([A-Za-z]+)"
或"([[:alpha:]]+)"
或"(\\w+)"
)来获取第一个单词
Dataframe1$COL2 <- gsub("([A-Za-z]+).*", "\\1", Dataframe1$COL1)
答案 1 :(得分:17)
您可以使用库(stringr)中的函数word():
Dataframe1$COL2 <- word(Dataframe2$COL1,1)
答案 2 :(得分:7)
函数strsplit
可能很有用
Dataframe1$COL2 <- strsplit(Dataframe1$COL1, " ")[[1]][1]
然后你可以改变最后一个括号内的数字来从字符串中选择其他部分。