我有一份包含人名的120777
条记录。我想为数据集中的每条记录存储一个名称部分数组。我在R中试过这个。
my_list$name_parts<- strsplit(my_list$name, " ")
我得到my_list$name_parts
作为120777
项的列表。当我尝试使用length(my_list$name_parts)
查询每个名称中的字数时,我得到120777
。
答案 0 :(得分:1)
让我们使用这个简单的例子:
my_list <- list()
my_list$name <- c("toto t. tutu", "foo bar")
要获得单词数,您可以这样做:
lapply(strsplit(my_list$name," "), length)
在上面的简单示例中给出:
[[1]]
[1] 3
[[2]]
[1] 2
为避免获得列表,您甚至可以这样做:
unlist(lapply(strsplit(my_list$name," "), length))
[1] 3 2