我正在尝试对我的数据进行情绪分析。数据包含多列中的消费者调查开放式问题答案。我想要R中每列的情绪分数和幅度。目前我已经尝试使用Google API,我已经创建了帐户,其中包含gl_nlp()中所有必需的密钥来自" googleLanguageR"在R中打包但是,如果我已在Google云帐户中签入了结算功能,则会在结算时出现错误。
那么,如何在不使用Google API且准确度相同的情况下找到R中的情绪分数和幅度(Polarity)?
答案 0 :(得分:1)
Here is a good approach使用由Julia Silge和David Robinson开发的tidytext
包。该软件包遵循tidyverse
包中的整洁方法。链接的书提到了存在:
三个通用词典
- 来自FinnÅrupNielsen的AFINN,
来自刘冰和合作者的- bing,
来自Saif Mohammad和Peter Turney的- 和nrc。
正如还提到的那样,get_sentiments()
函数允许您“获取特定的情感词典,而不包含该词典中未使用的列。”
如果不让我知道,希望这能回答你的问题!
答案 1 :(得分:0)
如果您已经从google api中提取了数据集,那么只需应用syuzhet
包。有关它的文档可以在这里找到:https://cran.r-project.org/web/packages/syuzhet/vignettes/syuzhet-vignette.html
只需写下:data.frame(get_sentiment(df[,col#]))
,这应该会给你数字情感分数。
答案 2 :(得分:0)
我同意Tito Sanz--整洁的文字方式是最好和最透明的。 它采用的方式和整齐的方法'进入是一个很好的习惯。
你也可以使用' QDap'包 - 如果你使用英语。它会以极性做你想做的事,但很难证明(我的意见)
我还使用了谷歌API - 它可以设置它的狗,但是如果你使用的是大型数据集 - 那么传递超过100万个字符就会受到限制。每24小时一次。一旦你超过信用额度,他们会向你收取很多费用。
如果您对情感分析有更具体的规定,请告诉我,