我对这个问题有了解释。我正在从tm::dtm
中提取最频繁的单词,如下所示:
> s1<-sort(rowSums(as.matrix(dtm10[,])), decreasing=TRUE)
我明白了:
290 429 318 125 128 425 431 153 52 385 144 491 126 423 111 130 492 163 176 391
916 875 860 851 844 823 822 766 759 743 701 700 686 673 670 669 663 658 652 623`
但是文档ID和rowSums
是一个元组。
> s1[2]
429
875
其中429是doc id,rowsum是875.我没有进一步使用rowSums
,我如何获得已排序文档ID的列表?我正在寻找一个矢量输出,如:
290 429 318 125 128 425 431 153 52 385 144 491 126 423 111 130 492 163 176 391
非常感谢。
答案 0 :(得分:1)
s1
是一个命名向量,名称为290,429,318等,值为916,875,860等。
要仅提取s1
的名称,我们可以使用
names(s1)
会给出:
#290 429 318 125 128 425 431 153 52 385 144 491 126 423 111 130 492 163 176 391