应用错误收集

如何在不使用Google API的情况下查找R中的情感分数和幅度（极性）？

时间：2018-05-22 12:18:08

标签： r text-mining sentiment-analysis

我正在尝试对我的数据进行情绪分析。数据包含多列中的消费者调查开放式问题答案。我想要R中每列的情绪分数和幅度。目前我已经尝试使用Google API，我已经创建了帐户，其中包含gl_nlp（）中所有必需的密钥来自＆＃34; googleLanguageR＆＃34;在R中打包但是，如果我已在Google云帐户中签入了结算功能，则会在结算时出现错误。

那么，如何在不使用Google API且准确度相同的情况下找到R中的情绪分数和幅度（Polarity）？

3 个答案:

答案 0 :(得分：1)

Here is a good approach使用由Julia Silge和David Robinson开发的tidytext包。该软件包遵循tidyverse包中的整洁方法。链接的书提到了存在：

三个通用词典


来自FinnÅrupNielsen的AFINN，
  来自刘冰和合作者的
bing，
  来自Saif Mohammad和Peter Turney的
和nrc。

正如还提到的那样，get_sentiments()函数允许您“获取特定的情感词典，而不包含该词典中未使用的列。”

如果不让我知道，希望这能回答你的问题！

答案 1 :(得分：0)

如果您已经从google api中提取了数据集，那么只需应用syuzhet包。有关它的文档可以在这里找到：https://cran.r-project.org/web/packages/syuzhet/vignettes/syuzhet-vignette.html

只需写下：data.frame(get_sentiment(df[,col#]))，这应该会给你数字情感分数。

答案 2 :(得分：0)

我同意Tito Sanz--整洁的文字方式是最好和最透明的。它采用的方式和整齐的方法＆＃39;进入是一个很好的习惯。

你也可以使用＆＃39; QDap＆＃39;包 - 如果你使用英语。它会以极性做你想做的事，但很难证明（我的意见）

我还使用了谷歌API - 它可以设置它的狗，但是如果你使用的是大型数据集 - 那么传递超过100万个字符就会受到限制。每24小时一次。一旦你超过信用额度，他们会向你收取很多费用。

如果您对情感分析有更具体的规定，请告诉我，