在R中将一个字符拆分为单独的单词

时间:2018-02-21 04:40:39

标签: r regex nlp stringr

我正在研究R中的项目(在TED_Talks数据集上)。我有一个数据框,其中一列称为“标签”,其中包含像

这样的字符

“游戏,性别,性别,女性主义,教育,文化”。

问题是,整行被读作单个字符。

我希望输出是包含单独单词的向量。例如:

“游戏”, “性别”, “性别”, “女性”, “教育”, “文化”

所以我可以对标签做进一步的分析。

1 个答案:

答案 0 :(得分:0)

您可以简单地执行以下操作: 假设您的条目位于对象a中,并且您希望将最终结果分配给对象b:

a <- "gaming,gender,sex,feminism,education,culture"
b <- unlist(strsplit(a, "[,]"))