Question

我是R编码的新手。我一直在尝试使用TM库来获得每个元素中的情绪百分比。

我开始使用：

Q(ss, aa)

之后尝试使用以下内容最小化不必要的单词：

   sc <- Corpus(VectorSource(email))

我得到一个看起来像的答案（每行都是“已发送”）：

从此我想找到最大值并计算它的百分比（不包括负面和正面）。例如，对于第2行：

最大值为：trust（40）百分比将是：32.5（最大值/总和（= 123）* 100）

我正在努力寻找所有数字的最大值和总和（每行由for循环打印）而没有最后2列

Answer 1

使用比你更小的例子......

sent <- data.frame(a1=c(1,2),a2=c(2,3),a3=c(4,1))
sent
  a1 a2 a3
1  1  2  4
2  2  3  1

您可以使用apply在基座R中执行此操作，如下所示...

sentsum <- data.frame(best=names(sent)[apply(sent,1,which.max)], #name of highest column
                      score=apply(sent,1,max), #value of highest column
                      stringsAsFactors = FALSE)
sentsum$percent <- 100*sentsum$score/rowSums(sent) #percent of row sum

sentsum
  best score  percent
1   a3     4 57.14286
2   a2     3 50.00000

R - 查找语料库向量的最大值

1 个答案: