dplyr文本挖掘列`text`必须是1d原子向量或列表

时间:2017-12-22 17:46:29

标签: r text-mining rapidminer

我正在尝试使用Tidytext(Text Mining with R),我想使用widyr库中的函数pairwise_count。我的输入看起来像:

my input table

这可能是RapidMiner Execute R运算符中的代码:

rm_main = function(data)
{
library(dplyr)
library(tidytext)
library(widyr)
set.seed(2017)

test <- data_frame(data) %>%
    pairwise_count(text, word)
    print(data)
 return(list(data))
}

当我执行代码时,我得到错误: “列data必须是1d原子向量或列表”

请问有人可以帮助我。

此致 托拜厄斯

1 个答案:

答案 0 :(得分:0)

在我等待您的数据集的详细信息时,我发现您的代码中几乎没有错误。 e.g:

  1. 如果data的{​​{1}}参数为rm_main,则无需将其转换为data.frame
  2. data.frame可以在代码的最开头加载。
  3. 功能library的参数不正确。该参数应与pairwise_countcolumn
  4. 中的data.frame名称相匹配

    更正后,函数及其在样本数据上的用法将为:

    data.table