如果满足两个条件,请从Quanteda中的语料库中删除文档

时间:2019-02-08 20:43:51

标签: r quanteda

create-user.dto指定应保留的文档,但是指定要放置的文档又如何呢?例如,假设我要删除文档中出现“ terorrism”一词的时间,只要该单词出现在2001年之前即可。

corpus_subset

1 个答案:

答案 0 :(得分:2)

corpus_subset保留正确描述的子集中指定的文档。因此,恐怖主义> = 1&Year <2001将返回以下文件。

            Year President FirstName Terrorism
1981-Reagan 1981    Reagan    Ronald         1

但是要得到相反的结果,就取反子集选择。这将选择除上面列出的文件以外的所有文件。

corpus_subset(data_corpus_inaugural, !(Terrorism >= 1 & Year < 2001))