R - 查找语料库向量的最大值

时间:2018-01-12 17:10:08

标签: r nlp text-mining corpus

我是R编码的新手。 我一直在尝试使用TM库来获得每个元素中的情绪百分比。

我开始使用:

Q(ss, aa)

之后尝试使用以下内容最小化不必要的单词:

   sc <- Corpus(VectorSource(email))

我得到一个看起来像的答案(每行都是“已发送”):

feelings

从此我想找到最大值并计算它的百分比(不包括负面和正面)。 例如,对于第2行:

最大值为:trust(40) 百分比将是:32.5(最大值/总和(= 123)* 100)

我正在努力寻找所有数字的最大值和总和(每行由for循环打印)而没有最后2列

1 个答案:

答案 0 :(得分:1)

使用比你更小的例子......

sent <- data.frame(a1=c(1,2),a2=c(2,3),a3=c(4,1))
sent
  a1 a2 a3
1  1  2  4
2  2  3  1

您可以使用apply在基座R中执行此操作,如下所示...

sentsum <- data.frame(best=names(sent)[apply(sent,1,which.max)], #name of highest column
                      score=apply(sent,1,max), #value of highest column
                      stringsAsFactors = FALSE)
sentsum$percent <- 100*sentsum$score/rowSums(sent) #percent of row sum

sentsum
  best score  percent
1   a3     4 57.14286
2   a2     3 50.00000