使用tidytext计算R中的字频时出错

时间:2018-02-02 19:56:18

标签: r string text-mining tidytext

我一直试图用tidytext包计算单词频率。

v <- "Everybody dance now! Give me the music Everybody dance now! Give me the music Everybody dance now! Everybody dance now! Yeah! Yeah! Yeah!"
v <- as.character(v)
v %>% count(words)

但是我收到了这个错误:UseMethod错误(&#34; as.quoted&#34;):   没有适用于&#39; as.quoted&#39;的方法应用于类&#34;函数&#34;

的对象

请帮忙!谢谢!

2 个答案:

答案 0 :(得分:3)

tidytext是允许您将字符串(在数据框中)转换为单词和其他内容的包。您可以将字符串转换为数据框,然后使用tidytext方法unnest_tokens将其转换为字词,然后使用dplyrgroup_by字词然后{{1他们:

count

答案 1 :(得分:0)

我正在处理一个类似的案例并调用 dplyr 与 count() 函数一起工作:

tokens %>%
# call dplyr   
dplyr::count(word)