应用错误收集

我觉得这应该更容易，但我无法弄清楚这一点。如何根据元数据过滤语料库中的文档。更具体地说，我有一个包含576个文档的语料库，每个文档都有标记＆＃39; Section＆＃39;。该部分有许多不同的值，例如，＆＃34;新闻＆＃34;，＆＃34;编辑＆＃34;和＆＃34;评论＆＃34;。
我如何使用tm_filter过滤出文件，比如说，有＃＆＃34;编辑＆＃34;和/或＆＃34;评论＆＃34;在这？对不起，我还没有提供可重复的数据。我真的不知道如何制作样本语料库。

按元数据设置语料库？

0 个答案: