Question

我是R的新手，目前正在将其用于yelp评论上的数据挖掘。

我目前正在尝试在NRC词典上pivot_wider，但始终出现以下错误：

"Values in `idf` are not uniquely identified; output will contain list-cols.
* Use `values_fn = list(idf = list)` to suppress this warning.
* Use `values_fn = list(idf = length)` to identify where the duplicates arise
* Use `values_fn = list(idf = summary_fun)` to summarise duplicates
no loop for break/next, jumping to top level"

这是我要运行到pivot_wider的代码：

revDTM_sentiNRC <- rrSenti_nrc %>%
  pivot_wider(id_cols = c(review_id,stars), 
              names_from = word, 
              values_from = idf) %>% 
  ungroup()

对于AFINN和Bing词典，我也取得了成功。

我尝试从代码中的错误中添加R的建议，但这不起作用。我也尝试过将此代码用于重复

rrSenti_nrc <- group_by(review_id) %>% distinct(words, .keep_all = TRUE)

这给了我以下错误：

"Error in group_by(review_id) : object 'review_id' not found"

我不理解，因为我的其余代码都能找到'review_id'，但这也许是解决问题的错误方法。

在此先感谢您的任何建议/帮助。

使用NRC dict扩大R中的“透视”范围，“无中断/下一个循环，跳至最高水平”

0 个答案: