我是R的新手,目前正在将其用于yelp评论上的数据挖掘。
我目前正在尝试在NRC词典上pivot_wider
,但始终出现以下错误:
"Values in `idf` are not uniquely identified; output will contain list-cols.
* Use `values_fn = list(idf = list)` to suppress this warning.
* Use `values_fn = list(idf = length)` to identify where the duplicates arise
* Use `values_fn = list(idf = summary_fun)` to summarise duplicates
no loop for break/next, jumping to top level"
这是我要运行到pivot_wider
的代码:
revDTM_sentiNRC <- rrSenti_nrc %>%
pivot_wider(id_cols = c(review_id,stars),
names_from = word,
values_from = idf) %>%
ungroup()
对于AFINN和Bing词典,我也取得了成功。
我尝试从代码中的错误中添加R的建议,但这不起作用。我也尝试过将此代码用于重复
rrSenti_nrc <- group_by(review_id) %>% distinct(words, .keep_all = TRUE)
这给了我以下错误:
"Error in group_by(review_id) : object 'review_id' not found"
我不理解,因为我的其余代码都能找到'review_id',但这也许是解决问题的错误方法。
在此先感谢您的任何建议/帮助。