标签: r text-mining tm
我觉得这应该更容易,但我无法弄清楚这一点。 如何根据元数据过滤语料库中的文档。更具体地说,我有一个包含576个文档的语料库,每个文档都有标记' Section'。该部分有许多不同的值,例如,"新闻","编辑"和"评论"。 我如何使用tm_filter过滤出文件,比如说,有#"编辑"和/或"评论"在这? 对不起,我还没有提供可重复的数据。我真的不知道如何制作样本语料库。