我正在尝试通过将报告的标记与情感词典进行比较来对PDF文档进行情感分析。要获取令牌列表,我正在使用以下步骤:
report <- pdf_text(files)
full_report <- paste(report, collapse = '')
tokens <- tokenize_words(full_report, stopwords = stop_words, strip_punct =
TRUE, strip_numeric = TRUE)
其结果是tokens
是长度为1的列表,tokens[1]
是长度为1,而tokens[[1]]
是令牌实际所在的位置,长度为3920。
我正在尝试获取report
的总体情感量
get_sentiments("bing")
tokens %>% inner_join(get_sentiments("bing")) %>%
count(sentiment)
但这又回来了
Error in UseMethod("inner_join") : no applicable method for 'inner_join' applied to an object of class "list"
如果我尝试
tokens[[1]] %>% inner_join(get_sentiments("bing")) %>%
count(sentiment)
它在UseMethod(“ inner_join”)中返回`Error:
没有适用于'inner_join'的适用于类对象的方法 “字符”`
关于如何使内部联接正常工作的任何建议?
预先感谢您的帮助!