从列中提取第一个单词并插入新列

时间:2015-08-10 17:38:02

标签: r dataframe extract

我有一个数据框,想要提取第一个单词并将其插入新列

is_contact

将其转换为:

Dataframe1:

COL1
Nick K Jones
Dave G Barros
Matt H Smith

3 个答案:

答案 0 :(得分:20)

您可以使用正则表达式("([A-Za-z]+)""([[:alpha:]]+)""(\\w+)")来获取第一个单词

Dataframe1$COL2 <- gsub("([A-Za-z]+).*", "\\1", Dataframe1$COL1)

答案 1 :(得分:17)

您可以使用库(stringr)中的函数word():

Dataframe1$COL2 <- word(Dataframe2$COL1,1)

答案 2 :(得分:7)

函数strsplit可能很有用

Dataframe1$COL2 <- strsplit(Dataframe1$COL1, " ")[[1]][1]

然后你可以改变最后一个括号内的数字来从字符串中选择其他部分。