r tm在排序操作后提取文档ID

时间:2016-11-03 07:01:51

标签: r tm

我对这个问题有了解释。我正在从tm::dtm中提取最频繁的单词,如下所示:

> s1<-sort(rowSums(as.matrix(dtm10[,])), decreasing=TRUE)

我明白了:

290 429 318 125 128 425 431 153  52 385 144 491 126 423 111 130 492 163 176 391 
916 875 860 851 844 823 822 766 759 743 701 700 686 673 670 669 663 658 652 623` 

但是文档ID和rowSums是一个元组。

> s1[2]
429 
875

其中429是doc id,rowsum是875.我没有进一步使用rowSums,我如何获得已排序文档ID的列表?我正在寻找一个矢量输出,如:

290 429 318 125 128 425 431 153  52 385 144 491 126 423 111 130 492 163 176 391

非常感谢。

1 个答案:

答案 0 :(得分:1)

s1是一个命名向量,名称为290,429,318等,值为916,875,860等。

要仅提取s1的名称,我们可以使用

names(s1)

会给出:

#290 429 318 125 128 425 431 153  52 385 144 491 126 423 111 130 492 163 176 391