使用NRC dict扩大R中的“透视”范围,“无中断/下一个循环,跳至最高水平”

时间:2019-11-27 06:12:03

标签: r tidyr

我是R的新手,目前正在将其用于yelp评论上的数据挖掘。

我目前正在尝试在NRC词典上pivot_wider,但始终出现以下错误:

"Values in `idf` are not uniquely identified; output will contain list-cols.
* Use `values_fn = list(idf = list)` to suppress this warning.
* Use `values_fn = list(idf = length)` to identify where the duplicates arise
* Use `values_fn = list(idf = summary_fun)` to summarise duplicates
no loop for break/next, jumping to top level"

这是我要运行到pivot_wider的代码:

revDTM_sentiNRC <- rrSenti_nrc %>%
  pivot_wider(id_cols = c(review_id,stars), 
              names_from = word, 
              values_from = idf) %>% 
  ungroup()

对于AFINN和Bing词典,我也取得了成功。

我尝试从代码中的错误中添加R的建议,但这不起作用。我也尝试过将此代码用于重复

rrSenti_nrc <- group_by(review_id) %>% distinct(words, .keep_all = TRUE)

这给了我以下错误:

"Error in group_by(review_id) : object 'review_id' not found"

我不理解,因为我的其余代码都能找到'review_id',但这也许是解决问题的错误方法。

在此先感谢您的任何建议/帮助。

0 个答案:

没有答案