在R中的全名列表中存储字符串中的单词数组

时间:2014-10-08 07:44:50

标签: r substring

我有一份包含人名的120777条记录。我想为数据集中的每条记录存储一个名称部分数组。我在R中试过这个。

my_list$name_parts<- strsplit(my_list$name, " ")

我得到my_list$name_parts作为120777项的列表。当我尝试使用length(my_list$name_parts)查询每个名称中的字数时,我得到120777

1 个答案:

答案 0 :(得分:1)

让我们使用这个简单的例子:

my_list <- list()
my_list$name <- c("toto t. tutu", "foo bar")

要获得单词数,您可以这样做:

lapply(strsplit(my_list$name," "), length)

在上面的简单示例中给出:

[[1]]
[1] 3

[[2]]
[1] 2

为避免获得列表,您甚至可以这样做:

unlist(lapply(strsplit(my_list$name," "), length))
[1] 3 2