如何在不使用Google API的情况下查找R中的情感分数和幅度(极性)?

时间:2018-05-22 12:18:08

标签: r text-mining sentiment-analysis

我正在尝试对我的数据进行情绪分析。数据包含多列中的消费者调查开放式问题答案。我想要R中每列的情绪分数和幅度。目前我已经尝试使用Google API,我已经创建了帐户,其中包含gl_nlp()中所有必需的密钥来自" googleLanguageR"在R中打包但是,如果我已在Google云帐户中签入了结算功能,则会在结算时出现错误。

那么,如何在不使用Google API且准确度相同的情况下找到R中的情绪分数和幅度(Polarity)?

3 个答案:

答案 0 :(得分:1)

Here is a good approach使用由Julia Silge和David Robinson开发的tidytext包。该软件包遵循tidyverse包中的整洁方法。链接的书提到了存在:

  

三个通用词典

     
      
  • 来自FinnÅrupNielsen的AFINN,
  •   来自刘冰和合作者的
  • bing,
  •   来自Saif Mohammad和Peter Turney的
  • 和nrc。
  •   

正如还提到的那样,get_sentiments()函数允许您“获取特定的情感词典,而不包含该词典中未使用的列。”

如果不让我知道,希望这能回答你的问题!

答案 1 :(得分:0)

如果您已经从google api中提取了数据集,那么只需应用syuzhet包。有关它的文档可以在这里找到:https://cran.r-project.org/web/packages/syuzhet/vignettes/syuzhet-vignette.html

只需写下:data.frame(get_sentiment(df[,col#])),这应该会给你数字情感分数。

答案 2 :(得分:0)

我同意Tito Sanz--整洁的文字方式是最好和最透明的。 它采用的方式和整齐的方法'进入是一个很好的习惯。

你也可以使用' QDap'包 - 如果你使用英语。它会以极性做你想做的事,但很难证明(我的意见)

我还使用了谷歌API - 它可以设置它的狗,但是如果你使用的是大型数据集 - 那么传递超过100万个字符就会受到限制。每24小时一次。一旦你超过信用额度,他们会向你收取很多费用。

如果您对情感分析有更具体的规定,请告诉我,